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Prefacio 


Este es el libro que dije que nunca escribiría. Es la continuación del libro 
Memoria de Trabajo, un libro que terminé hace unos 20 años, y que básicamente 
fue un informe de un amplio programa de investigación que comenzó en 1960, 
cuando el estudio de la memoria a corto plazo (MCP) estaba en sus días de 
gloria, y que continuó durante su pérdida de popularidad en 1970 al igual que el 
concepto de memoria de trabajo que propusimos Graham Hitch y yo, más 
amplio y funcionalmente basado (Baddeley y Hitch, 1974). Con la publicación 
de Memoria de Trabajo en 1986, el interés ha comenzado a aumentar 
sustancialmente, publicándose 51 artículos con el título «memoria de trabajo», 
un proceso que ha continuado hasta el punto en que ahora mismo se publican 
cerca de 800 artículos al año con el título «memoria de trabajo» y 3.700 artículos 
con «memoria de trabajo» en el título, en la palabra clave o en el resumen. Por 
supuesto, aunque no todos tienen relación directa con el modelo 
multicomponente, cuando alguna vez alguien me sugería que actualizara el libro 
de 1986, al comprobar la cantidad de literatura que se estaba acumulando, 
aseguraba que nunca lo actualizaría. 


Aun así, seguí percibiendo que algunos colegas míos hacían anotaciones sobre 
nuestro modelo, sugiriendo que sus datos eran incompatibles con él, a pesar del 
hecho de que el modelo había evolucionado posteriormente, lo que convertía 
cualquier crítica específica en inadecuada. Existía una clara necesidad de 
actualizar el modelo, pero seguía negándome ante la ingente cantidad de material 
que tendría que cubrir con la revisión. Entonces se me ocurrió el plan, 
aparentemente más abordable, de escribir un amplio ensayo, dedicando todo un 
verano para poder llevarlo a cabo. Cuando llegó el otoño, solo había llegado a la 
mitad de la primera sección sobre el bucle fonológico. Aún me quedaba 
demasiado por tratar. Un tiempo después, me surgió una segunda oportunidad 
cuando fui invitado a pasar el año académico 2001-2002 en el Centro de 
Estudios Avanzados en Ciencias de la Conducta en Stanford. Entonces decidí 
intentarlo otra vez. 


El Centro parecía el lugar adecuado para llevar a cabo mi empresa, dado que el 
término «memoria de trabajo» parecía haber sido inventado allí por Miller, 


Galanter y Pribram (1960) al elaborar su clásica contribución a la ciencia 
cognitiva, Los Planes y la Estructura de la Conducta. Es más, descubrí que me 
habían asignado el despacho ocupado anteriormente por Richard Atkinson, de 
cuyo modelo, junto con el de Shiffrin (Atkinson y Shiffrin, 1968), sacamos 
Graham Hitch y yo el término de «memoria de trabajo», aunque nuestro modelo 
se distinguía del suyo de forma importante. Parecía un buen presagio. 


Cada año, el Centro alojaba cerca de 40 estudiantes con conocimientos que 
variaban desde historia y ciencias políticas, hasta antropología, sociología, 
psicología y neurociencia. La disponibilidad de esta variedad de disciplinas me 
animó a asumir, quizá tontamente, la ambiciosa tarea de intentar situar el 
concepto de memoria de trabajo dentro de un contexto intelectual más amplio. 
Siempre existe la tentación, cuando se habla del concepto de memoria de trabajo, 
de resaltar su importancia como base de la cognición compleja y el pensamiento 
racional. Y, sin embargo, desde nuestros primeros experimentos, la mayor parte 
de los progresos refinando el modelo han llegado a descubrir lo que esta 
memoria no hace. Con todo un año por delante, y mis primeros compromisos 
aparcados, decidí que pensaría con profundidad las implicaciones del modelo 
multicomponente de la memoria de trabajo, e investigaría una serie de áreas que 
podrían aclarar el desarrollo del modelo. Comencé mi tarea hacia finales del 
verano, con la esperanza de terminarlo por Navidades. Finalmente, unos cinco 
años después estoy terminando el libro que se ha convertido en algo más que un 
amplio ensayo. ¿Qué es lo que salió mal entonces? 


Habiendo comenzado con el bucle fonológico, y viendome asfixiado con los 
detalles, decidí que comenzaría con el componente del ejecutivo central, sobre la 
base errónea de que este era el componente sobre el que menos sabíamos; de 
hecho en el libro de 1986 solo se había mencionado en el último capítulo. Sin 
embargo, en los últimos años ha aparecido una gran cantidad de investigación 
relacionada con el procesamiento ejecutivo, la mayoría relacionada con el 
estudio de los lóbulos frontales. Es más, el ejecutivo central es el componente de 
la memoria de trabajo que se une de forma más natural con otra serie de campos. 
Por ejemplo, discutiendo con dos colegas míos, psicólogos sociales del centro, 
John Bargh y Roy Baumeister, me sugirieron que su investigación se podía unir 
claramente con la explicación que dan Norman y Shallice (1986) del control de 
la acción y que a su vez forma la base de mi propia explicación del ejecutivo 
central. También comencé a ver vínculos potenciales con algunos temas 
filosóficos clásicos como la naturaleza de la conciencia y el libre albedrío. Al 
mismo tiempo descubrí excitantes e importantes evidencias en la neurociencia 


cognitiva que parecían estar relacionadas directamente con el modelo 
multicomponente de la memoria de trabajo. El resultado es un libro mucho más 
largo, amplio y ambicioso de lo que nunca anticipé. 


Me hubiera gustado escribir un libro que fuera un todo fluido, en el que la 
experimentación se construyera en base a teorías generales que a su vez dieran 
lugar a la especulación como una parte más amplia de la teoría. Tristemente, esto 
no funcionó. El hueco entre, por ejemplo, el análisis detallado del bucle 
fonológico y las especulaciones sobre las implicaciones más amplias del 
concepto de memoria de trabajo sobre la conciencia y el control de la acción era 
demasiado grande. Por eso, el libro se divide en dos mitades, la primera 
relacionada con los desarrollos dentro del modelo multicomponente, y la 
segunda relacionada con su potencial papel en la conducta social y emocional, 
en la conciencia y en el control de la acción. 


La primera parte se dedica a la tarea que, quizá sabiamente, declaré que nunca 
intentaría escribir: la de repasar los últimos 20 años de investigación en la 
memoria de trabajo. Su punto fuerte reside en el hecho de que he estado 
activamente involucrado en la mayoría de las áreas que se discuten. Sin 
embargo, no digo que haya cubierto de forma rigurosa, ecuánime y académica, la 
cantidad de literatura que se ha dado en este período, aunque lo haya intentado. 
Inevitablemente, he intentado ver la literatura desde la perspectiva del modelo 
multicomponente de la MT, y he empleado mis propias investigaciones más de 
lo preciso. Ciertamente, no puedo decir que haya leído toda la literatura, incluso 
de las áreas más próximas a mi investigación. Es más, estoy seguro de que, en 
línea con la literatura sobre las tareas autoejecutables (Englekamp, 1998), mi 
recuerdo de lo que he hecho es bastante mejor que mi recuerdo de lo que he 
leído. Por tanto, si tú mismo estás trabajando en esta área, estoy seguro de que 
conocerás estudios, quizá realizados por ti mismo, que podrían y deberían haber 
sido incluidos. Por favor, acepta mis disculpas. 


La segunda parte del libro es muy distinta, tanto en sus puntos fuertes como en 
los débiles. Intenta situar el concepto de memoria de trabajo en un contexto más 
amplio, explorando enlaces con el estudio de la conducta social, la emoción, la 
conciencia y el control de la acción, que a la vez suscita algunos de los temas 
filosóficos clásicos de la conciencia y el libre albedrío. Estos vínculos 
potenciales me parecen fascinantes, y espero que mi entusiasmo anime a trabajar 
más sobre estas áreas relacionándolas. Sin embargo, no puedo declararme un 
experto en estos temas, y he confiado en artículos revisados más de lo que me 


hubiera gustado. En algunos casos he encontrado estas revisiones 
particularmente útiles, y he intentado reflejarlo así en el texto. ¿Qué se ha 
conseguido entonces? 


Quería escribir un libro que fuera accesible y útil a una gran cantidad de lectores 
potenciales. He comenzado, por tanto, con un capítulo introductorio que 
proporciona una revisión del modelo tal como era cuando completé mi libro en 
1986. Después, he seguido discutiendo el bucle fonológico, que es 
probablemente el componente más simple y mejor comprendido de la memoria 
de trabajo. Sin embargo, esto me supuso un problema de inmediato. Es un área 
que ha sufrido una gran cantidad de análisis detallados, que nos ha llevado a 
controversias complejas y modelizaciones computacionales sofisticadas. Creo 
que es esencial cubrir esto, ya que refleja claramente las posibilidades de 
desarrollo de lo que comenzó siendo un simple modelo descrito verbalmente. Sin 
embargo, un lector de fuera que se encuentre con esto en el primer capítulo, 
podría pensar razonablemente «¡esto no es para mí!». Por ello, en lugar de 
comenzar bombardeando al lector con modelos computacionales e interacciones 
de tercer orden, comienzo con la cuestión acerca de la función que desempeñaría 
el bucle fonológico, con la idea de convencer al lector de que esta es un área de 
cierta importancia, continúen o no con el Capítulo 3, más especializado. Quizá 
sea relevante destacar en este punto, que he intentado escribir los capítulos de 
forma que no sea necesario leerlos de forma secuencial desde el primero hasta el 
final, aunque es conveniente leerlos en orden cuando un mismo tema sea 
cubierto por dos capítulos, como ocurre a menudo. 


Del bucle fonológico pasé a la agenda visoespacial, con un capítulo acerca del 
almacenamiento a corto plazo de la información visual y espacial, y otro 
relacionado con las imágenes y la manipulación de información visoespacial. El 
Capítulo 6 está relacionado con un método de almacenamiento algo distinto, 
unido clásicamente al concepto de MCP, concretamente el efecto de recencia, 
que se interpreta como combinación entre un priming pasivo y un mecanismo de 
recuperación activo. 


Los tres capítulos siguientes están relacionados con el ejecutivo central y el 
búfer episódico, componentes de la memoria de trabajo. No tratan de revisar la 
amplia y creciente literatura sobre el control ejecutivo, sino centrarse en mi 
propio intento de fraccionar y elaborar el concepto inicial de ejecutivo central, 
dejando para los siguientes capítulos las amplias implicaciones del control 
ejecutivo y atencional, concretamente, los dos capítulos siguientes acerca de las 


diferencias individuales en memoria de trabajo tratan primordialmente del 
análisis del procesamiento ejecutivo. La primera parte del libro concluye con una 
discusión acerca de la aplicación de las técnicas de neuroimagen al estudio de la 
memoria de trabajo. 


Como se mencionó anteriormente, la segunda parte del libro intenta situar la 
memoria de trabajo en una perspectiva más amplia. Al capítulo relacionado con 
las posibles conexiones con la psicología social le siguen dos capítulos 
relacionados con la memoria de trabajo y la emoción. El primero se centra en los 
efectos del miedo y la ansiedad, un área en la que ya se han explorado 
activamente los claros vínculos entre la memoria de trabajo y la interrupción de 
la cognición a través de la emoción, y que se extiende a otros temas clínicamente 
importantes como el anhelo y la adicción. La unión entre memoria de trabajo y 
depresión, que se explora en el Capítulo 15, está menos clara. Este ha sido el 
capítulo más desafiante, pero posiblemente el más productivo, ya que especifica 
más detalladamente la conexión entre emoción y memoria de trabajo, junto con 
un marco de trabajo nuevo que ofrece la posibilidad de proporcionar una unión 
conceptual entre el enfoque psicológico y el enfoque neurobiológico de la 
depresión. 


Siguiendo con la línea especulativa, el Capítulo 16 está relacionado con 
explicaciones sobre el fenómeno de la conciencia basadas empíricamente, 
acentuando la unión potencial entre la memoria de trabajo y las teorías de la 
conciencia basadas en la hipótesis del espacio de trabajo global. El papel de la 
conciencia, y por tanto el de la memoria de trabajo, en el control de la acción, 
constituye el foco del siguiente capítulo. El libro termina con el intento de situar 
la memoria de trabajo en un amplio contexto evolutivo, y explorar sus 
implicaciones a la hora de tratar cuestiones filosóficas clásicas sobre la 
conciencia y el libre albedrío. Si crees que esta forma de terminar el libro es algo 
insólita para un psicólogo experimental, solo puedo coincidir contigo; culpo de 
ello a mi año de estancia en California. 
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CAPÍTULO 1 


Introducción y visión general 


Se supone que la memoria de trabajo es un sistema de almacenamiento temporal 
bajo control de la atención que refuerza nuestra capacidad para el pensamiento 
complejo. Considera la tarea de enseñarle a un amigo cómo llegar desde la 
estación de tren a su casa: probablemente necesites crear algún tipo de 
representación visoespacial del distrito, elaborar la mejor ruta, y transformarla en 
instrucciones verbales comprensibles para tu amigo. Él tendrá que realizar una 
tarea parecida, aunque en orden inverso, tomando notas o confiando en su 
memoria a largo plazo. Considera el simple ejercicio de multiplicar 27 por 9. 
Habiendo multiplicado el 7 por el 9, necesitas almacenar temporalmente el 3, 
«llevarte» el 6, manteniéndolo hasta que multipliques el 2 por el 9, después 
sumarle 6, recuperar el 3 y terminar con la respuesta 243. Una vez terminado, sin 
duda recordarás el resultado, al menos brevemente, pero probablemente no los 
resultados de los pasos previos. 


El estudio de la memoria de trabajo está relacionado con el modo en que se lleva 
a Cabo esa manipulación y almacenamiento temporal. Su estudio se basó 
inicialmente en el concepto de un simple almacén unitario de memoria temporal, 
la memoria a corto plazo (MCP). A lo largo de los años, sin embargo, se ha ido 
poniendo de manifiesto con más claridad que se necesita más que un simple 
almacenamiento para un sistema que efectivamente forma la interfaz crucial 
entre percepción y memoria, y entre atención y acción. 


Existen muchas aproximaciones a la memoria de trabajo; la mayoría poseen 
características comunes, aunque este acuerdo básico puede verse oscurecido por 
el hecho de que a menudo diferentes teóricos acentúen fenómenos distintos y 
utilicen una variedad de métodos de desarrollo teórico. Mi propio enfoque se ha 
conducido ampliamente de manera empírica, confiando principalmente en los 
métodos de investigación cognitiva de la memoria, y se ha visto fuertemente 
influenciada por la neuropsicología. Como tal, ha tendido a permanecer cercana 
a los datos, desdeñando las implicaciones más amplias del modelo que se estaba 


desarrollando. Los capítulos que siguen tratan de hacer dos cosas: proporcionar 
una explicación actualizada del modelo basado empíricamente, y luego situar el 
concepto de memoria de trabajo en su contexto teórico más amplio. 
Inevitablemente esto requiere una gran cantidad de especulación, extendiéndose, 
como de hecho ocurre, a temas tan clásicos como la naturaleza de la conciencia 
y la voluntad. Comenzaré con un breve repaso histórico. 


1.1. Algo de historia 


William James (1890) propuso una distinción entre una memoria primaria 
temporal, que describió como «borde posterior de la conciencia», y una memoria 
secundaria, más duradera. Hacia mediados del siglo veinte, sin embargo, la idea 
dominante en la psicología experimental era la existencia de un único sistema de 
memoria en el que el aprendizaje reflejaba la formación de asociaciones, y el 
olvido se debía a interferencias entre asociaciones en competición (McGeoch e 
Irion, 1952). En 1949, Donald Hebb reavivó la concepción de los dos 
componentes, especulando que podía haber dos tipos de memoria, una memoria 
a corto plazo (MCP), que dependería de la actividad eléctrica temporal del 
cerebro, y una memoria a largo plazo (MLP), representada por cambios 
neuroquímicos más duraderos. Esta concepción fue apoyada por Brown (1958) 
en Reino Unido, y por Peterson y Peterson (1959) en Estados Unidos. En los dos 
casos se observó una rápida pérdida en pocos segundos de pequeñas cantidades 
de información cuando se impedía el repaso. Dado que la tarea para impedir el 
repaso no incluía material que fuera similar al de los ítems que debían ser 
recordados, descartaron la teoría clásica de la interferencia basada en la 
similitud, proponiendo en su lugar la existencia de una huella de memoria que 
decaía rápidamente con el tiempo. 


1.1.1. ¿Cuántos tipos de memoria? 


Esto llevó a una gran controversia en 1960. Keppel y Underwood (1962) 


mostraron que el olvido en la tarea de Peterson era mínimo en el primer ensayo 
del experimento, creciendo rápidamente a lo largo de los ensayos siguientes, lo 
que sugería que el olvido se podría interpretar en términos de una interferencia 
proactiva de los primeros ítems del experimento. Melton (1962) demostró que la 
amplitud de dígitos, la clásica tarea de MCP que implica el recuerdo serial 
inmediato de una cadena de dígitos, también tenía un componente a largo plazo, 
concluyendo que no era necesario asumir un sistema separado de MCP. En 
respuesta a esto, Waugh y Norman (1965) señalaron la necesidad de distinguir 
entre los paradigmas experimentales y el hipotético sistema cognitivo, o los 
sistemas que supuestamente contribuían a la realización de dichas tareas. 
Siguiendo a William James (1890), ellos usaron el término de memoria primaria 
para el hipotético sistema a corto plazo, y el de memoria secundaria para el 
sistema a largo plazo, utilizando MCP y MLP para referirse a los respectivos 
paradigmas experimentales, dando por hecho que el rendimiento en tareas de 
MCP siempre tendería a tener en la práctica un componente basado en MLP. 


Evidencias adicionales acerca de la existencia de al menos dos sistemas de 
memoria provinieron de un detallado estudio de pacientes neuropsicológicos. 
Los clásicos pacientes amnésicos que suelen tener una lesión bilateral en los 
lóbulos temporales y del hipocampo (Milner, 1966) muestran una capacidad 
devastadoramente pobre para el rendimiento en tareas de MLP, pero buena 
capacidad en las tareas clásicas de MCP como la de amplitud de dígitos 
(Baddeley y Warrington, 1970). 


Al mismo tiempo, Shallice y Warrington (1970) describieron pacientes que 
mostraban el patrón opuesto, una MLP normal, combinada con una amplitud de 
dígitos de solo uno o dos ítems, y un rendimiento muy pobre en la tarea de 
Peterson. Esta disociación doble en el rendimiento en tareas de MLP y MCP 
sugirió fuertemente la necesidad de asumir procesos separados. 


Más evidencia para una dicotomía provino de las tareas de dos componentes, 
como la de recuerdo libre, en la que los sujetos intentan recordar una lista de 
palabras en cualquier orden: los ítems más recientes tienden a ser bien 
recordados si el recuerdo es inmediato, el efecto de recencia. El efecto de 
recencia se pierde, sin embargo, si se introduce una breve demora con relleno 
entre la presentación y el test, mientras que los primeros ítems, que se supone 
que reflejan el componente a largo plazo, no se ven afectados por esta breve 
demora (Glanzer, 1972; Glanzer y Cunitz, 1966). El efecto de recencia está 
preservado en pacientes amnésicos pero está deteriorado en pacientes con un 


rendimiento defectuoso en MCP, mientras que el recuerdo de los primeros ítems, 
que supuestamente dependen de la MLP, muestra el patrón opuesto, mostrándose 
gravemente deteriorado en pacientes amnésicos pero preservado en pacientes 
con una MCP defectuosa (Baddeley y Warrington, 1970; Shallice y Warrington, 
1970). 


1.1.2. El modelo modal 


Hacia finales de 1960, se tendía a favorecer la distinción entre dos o más tipos de 
memoria, lo que se reflejó en numerosos modelos de memoria, de los cuales el 
más influyente fue el de Atkinson y Shiffrin (1968), que llegó a ser conocido 
como el modelo modal. Este modelo suponía tres tipos separados de memoria 
(ver Fig. 1.1). El más breve de los tres era una serie de sistemas sensoriales de 
memoria que quizá sean mejor considerados como componentes del 
procesamiento perceptivo. Estos incluían una memoria sensorial visual 
(Sperling, 1960), algunas veces denominada memoria icónica, y su equivalente 
sistema sensorial de almacenamiento acústico (Crowder y Morton, 1969), que 
Neisser denominó memoria ecoica (1967). Sin embargo, también se pensó que 
otros sistemas sensoriales incluían alguna forma de almacenamiento temporal 
(Atkinson y Shiffrin, 1968). Se supuso que la información fluía desde una serie 
de sistemas sensoriales de memoria paralelos hasta un único almacén a corto 
plazo. Este actuaba como una memoria de trabajo con una capacidad informativa 
limitada, el almacén a corto plazo (ACP). El ACP podía alojar la información y 
al mismo tiempo manipularla, y se supuso que era responsable tanto de la 
codificación de la información en la MLP como de la recuperación subsiguiente. 
El ACP de capacidad limitada interactuaba así con el almacén a largo plazo 
(ALP) de mucha mayor capacidad. Por tanto, el aprendizaje a largo plazo 
dependía tanto del ALP como del ACP. 
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Fig. 1.1. El modelo de procesamiento de la información propuesto por Atkinson 
y Shiffrin (1968). La información fluye desde el ambiente a través de una serie 
de registros sensoriales hasta un almacén a corto plazo, que juega un papel 
crucial controlando el flujo de información hacia dentro y hacia fuera del 
almacén a largo plazo. 


1.1.3. Problemas con el modelo modal 


Inicialmente, parecía que el modelo modal daba cuenta de una gran cantidad de 
datos disponibles. Sin embargo, se encontraron al menos dos problemas. El 
primero de ellos concernía a sus supuestos respecto al aprendizaje, que 
proponían que el mero mantenimiento de la información en el ACP era suficiente 
para ser transferida al ALP; cuanto más tiempo se mantuviera la información, 
mayor probabilidad de transferencia, y mejor aprendizaje. Sin embargo, los 
intentos de poner esto a prueba directamente fueron infructuosos (Crack y 
Watkins, 1973; Tzeng, 1973; Bjork y Whitten, 1974). Mucho más importante 
que el simple paso del tiempo era la naturaleza de las operaciones realizadas 
sobre el material que se estaba aprendiendo, los ítems procesados puramente en 
términos de su apariencia física se retenían pobremente y los ítems que eran 
verbalizados se recordaban algo mejor, pero no tan bien como los ítems 
ricamente codificados en términos de su significado, esto fue interpretado por 
Craik y Lockhart (1972) en términos de su muy influyente hipótesis de los 
Niveles de Procesamiento. Esta hipótesis proponía que el grado de aprendizaje a 
largo plazo dependía de la profundidad y riqueza de la codificación y no de la 
cantidad de tiempo que el material se mantuviera en el ACP, como Atkinson y 
Shiffrin habían asumido. 


El segundo problema era inherente a las evidencias neuropsicológicas. Si el ACP 
proporcionaba una plataforma para el proceso de aprendizaje a largo plazo, 
entonces los pacientes con un déficit en el sistema ACP deberían mostrar 
también un rendimiento deteriorado en la MLP, lo que no ocurría (Shallice y 
Warrington, 1970). Además, si el sistema sirve como una memoria de trabajo de 
propósito general, entonces esos pacientes deberían verse perjudicados en 


muchas tareas cognitivas diferentes. Claramente, este no era el caso. Uno de los 
pacientes de memoria a corto plazo desempeñaba con eficacia su trabajo como 
secretaria, mientras que otro llevaba una tienda y una familia, y un tercero era un 
próspero taxista. Sus problemas parecían ser de naturaleza limitada, sin dar 
muestras de una disfunción cognitiva general como la que se esperaría de un 
paciente con una memoria de trabajo gravemente deteriorada. 


1.2. Memoria de trabajo multicomponente 


Esta era la situación cuando Graham Hitch y yo comenzamos la investigación 
con una subvención que iba dirigida a comprender la relación entre la memoria a 
corto plazo y la memoria a largo plazo, en un punto en el que el estudio de la 
MCP estaba perdiendo rápidamente su popularidad a favor de la investigación de 
nuevas y excitantes áreas de la MLP como los niveles de procesamiento (Craick 
y Lockhart, 1972) y la naturaleza de la memoria semántica (Collins y Quillian, 
1969; Collins y Loftus, 1972). 


Elegimos trabajar en la sencilla cuestión acerca de la función que desempeñaba 
la MCP si es que no era una memoria de trabajo. No teníamos acceso a pacientes 
de memoria a corto plazo, pero en su lugar decidimos usar una metodología de 
doble tarea para desorganizar selectivamente la MCP de sujetos normales. A 
pesar de sus diferencias, todos los modelos existentes de MCP parecían estar de 
acuerdo en que esta memoria era necesaria para el recuerdo serial inmediato de 
dígitos, y todos coincidían en que la limitada amplitud para los dígitos se debía a 
la capacidad limitada de la MCP. Por ello, solicitábamos a nuestros sujetos que 
repitieran continuamente secuencias aleatorias de dígitos, mientras realizaban 
una segunda tarea que supuestamente dependía de la operación de un sistema de 
memoria de trabajo de capacidad limitada. Simplemente el pedir que se repita un 
ítem impediría el repaso vocal observable, pero solo impondría una mínima 
carga de almacenamiento. Aumentar el número de dígitos hasta tres, seis o más, 
ocuparía una proporción sucesivamente mayor de la capacidad disponible de la 
MCP. Este incremento sucesivo de dígitos concurrentes debería reflejarse en un 
rendimiento progresivamente menor en cualquier tarea que dependiera mucho de 
la memoria de trabajo. 


Elegimos estudiar el razonamiento verbal, la comprensión y el aprendizaje a 
largo plazo, de manera que en cada caso se realizaba la tarea a la vez que se 
recitaban cadenas de dígitos. Nuestra tarea de razonamiento implicaba la 
verificación de frases que variaban en su complejidad sintáctica. Cada frase 
describía el orden de dos letras, A y B, e iba seguida por un par de letras, por 
ejemplo, A sigue a B— BA, a lo que el sujeto debería responder «verdadero». La 
dificultad de la tarea se manipulaba mediante el uso de la negación y la pasiva, 
por ejemplo, B no es precedida por A— AB, que debería evocar la respuesta 
«falso». Los sujetos ejecutaban esta tarea presentada visualmente mientras 
repasaban en voz alta secuencias de números aleatorios que variaban en longitud 
desde cero a ocho dígitos. Los resultados se muestran en la Fig. 1.2, en la que 
aparece tanto el tiempo medio en responder como el porcentaje medio de errores 
en cada nivel de carga de dígitos. Se observa un claro incremento en el tiempo 
de respuesta con el aumento en la carga de dígitos, aunque es importante 
destacar que incluso la mayor carga solo supone un incremento del 50% en el 
tiempo de respuesta. Quizá más sorprendente sea la tasa de error, que no se ve 
afectada por una carga concurrente que alcanza, e incluso en algunos sujetos 
supera, la amplitud de dígitos. Resultados ampliamente similares se obtuvieron 
cuando estudiamos el efecto de la carga concurrente de dígitos sobre tareas que 
implicaban o bien aprendizaje, o bien comprensión de prosa. Por tanto, el 
sistema que subyace a la retención de dígitos se parece a un sistema de memoria 
de trabajo en el que una disminución de su capacidad deteriora el 
funcionamiento cognitivo, pero el grado de deterioro es mucho menor del que 
hubiera predicho el modelo modal. Decidimos abandonar el supuesto de una 
MCP unitaria y reemplazarla por un sistema multimodal, que denominamos 
memoria de trabajo. 


Elegimos el término memoria de trabajo para acentuar el papel funcional del 
sistema propuesto, más que simplemente su capacidad de almacenamiento. El 
término ya estaba en uso, aunque no era común en la psicología cognitiva. 
Parece que había sido acuñado por Miller, Galanter y Pribram (1960), aunque 
dijeron poco sobre sus características. El término también fue utilizado por 
Atckinson y Shiffrin para describir el papel funcional de su almacén a corto 
plazo. Ambos usos son ampliamente equivalentes al nuestro, sin embargo cabría 
mencionar también otros dos usos que son diferentes. El término de memoria de 
trabajo también se aplica a un componente de los modelos de sistemas de 
producción en inteligencia artificial (Newell y Simon, 1972), refiriéndose a un 
sistema de capacidad ilimitada que mantiene reglas de producción si-entonces 
que subyacen a dichos modelos. También se ha usado de otro modo en la 


literatura sobre aprendizaje animal (Olton, 1979) para referirse a la ejecución de 
tareas como la tarea de los brazos radiales en la que se pide a los animales que 
recuerden el resultado de una serie de ensayos relacionados que se han ejecutado 
en un mismo día. 
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Fig. 1.2. La influencia de una tarea de memoria concurrente sobre el 
razonamiento verbal. Cuanto más larga era la secuencia de dígitos concurrente, 
más lenta era la respuesta. Sin embargo, el decremento no fue masivo en 
absoluto, y no tuvo efecto sobre la precisión. Datos de: Working Memory de 
Baddeley (1986). Reproducido con el permiso de Oxford University Press. 


Sin embargo, para bien o para mal, se ha incrementado el uso del término de 
memoria de trabajo en el sentido adoptado por nosotros, para referirse a la 
capacidad limitada del sistema de almacenamiento temporal que subyace al 
pensamiento complejo humano. A menudo, aunque no siempre, se supone que 
este sistema incluye múltiples componentes (Miyake y Shah, 1999a; Smith y 
Jonides, 1996, 1997). El término MCP se sigue usando para describir tareas en 
las que se pide el recuerdo inmediato de pequeñas cantidades de información, y 
el término de memoria de trabajo, para referirse a un sistema más amplio que 
típicamente implica control atencional y permite la manipulación de información 
mantenida en el almacén a corto plazo. El término MCP se sigue usando para 
describir diversas tareas como la de amplitud de dígitos o el paradigma de olvido 
a corto plazo de Peterson. Como se ha señalado antes, es probable que estas 
tareas posean componentes a largo y corto plazo. Sin embargo, muchos de los 
estudios que se centran explícitamente en el almacenamiento a corto plazo (ver 
Capítulos 2-4) puede que sigan usando el término MCP para referirse tanto a las 
tareas como a los procesos subyacentes que se asumen teóricamente, confiando 
en el contexto para aclarar si se refieren a una tarea o a un sistema (e.g., 
Gathercole, 1996; Vallar y Papagno, 2002). 


1.3. El modelo multicomponente 


Para explicar nuestro patrón de datos, sugerimos que el almacén unitario a corto 
plazo propuesto por Atkinson y Shiffrin debería ser reemplazado por una 
memoria de trabajo de tres componentes (Baddeley y Hitch, 1974). Esta 
comprendía un sistema de control atencional —el ejecutivo central— junto con dos 


sistemas subsidiarios de almacenamiento, el bucle fonológico y la agenda 
visoespacial (ver Fig. 1.3). Los tres sistemas tenían una capacidad limitada, 
aunque la naturaleza de sus limitaciones difería. Se supuso que el bucle 
fonológico era capaz de mantener información hablada y posiblemente 
información puramente acústica en un almacén temporal. Se asumió que el 
almacenamiento dependía de una huella de memoria que se desvanecería en 
segundos a menos que se refrescara mediante el repaso. Se supuso que el repaso 
dependía de la vocalización tanto en voz alta como en voz baja. 


La agenda visoespacial realizaba una función similar para la información visual 
y espacial. Se suponía que había repaso mental, y que posiblemente, aunque no 
necesariamente, implicaba movimientos oculares (Baddeley, 1986, p. 116-121; 
Postle et al. , 2006). En el modelo inicial, se suponía que el ejecutivo central 
incluía un fondo limitado de capacidad general de procesamiento. Dejamos sin 
especificar con precisión su naturaleza, concentrándonos en lugar de ello en los 
subsistemas, que parecían ofrecer un desafío más manejable. A la larga, un 
modelo Ejecutivo de memoria de trabajo que no dé cuenta del control ejecutivo 
se vuelve efectivamente un simple modelo de almacén, aunque un ACP de dos 
componentes. A lo largo de los años el intento por rellenar el hueco dejado por el 
ejecutivo inespecífico ha supuesto una gran preocupación, y se reflejará de 
forma repetida en los capítulos posteriores. Cada uno de los tres componentes se 
describe con detalle más abajo. 


Fig. 1.3. El modelo de memoria de trabajo de tres componentes propuesto por 
Baddeley y Hitch (1974). Reproducido con el permiso de Oxford University 
Press. 


1.3.1. El bucle fonológico 


Se supuso que el bucle incluía un almacén fonológico y un mecanismo de repaso 
articulatorio: la evidencia acerca de la naturaleza del almacén provino 
principalmente del efecto de similitud fonológica. Conrad (1964) observó que 
cuando los sujetos intentaban recordar secuencias de consonantes presentadas 
visualmente, tendían a cometer errores «acústicos», por ejemplo, recordaban 
erróneamente la B como V, o la F como M. Conrad y Hull (1964) demostraron 
que secuencias de letras fonológicamente similares como BD TG CPse 
recordaban con menos exactitud que secuencias fonológicamente distintas como 
FK Y WR Q*. Propusieron que la MCP dependía de una huella de memoria 
acústica, en la que los ítems presentados visualmente se traducían a un código 
acústico mediante el habla subvocal. Conrad usó el término de similitud 
«acústica», ya que lo definió en términos de errores de escucha sobre ruido. Yo 
personalmente prefiero el término «fonológico» para referirme a los sistemas de 
almacenamiento subyacentes. El término pretende dejar abierta la naturaleza 
precisa del código, ya que los intentos previos de especificar esto no han 
resultado concluyentes (Hintzman, 1967; Wickelgren, 1969). Yo mismo amplié 
este hallazgo al caso de las palabras, encontrando que la secuencia casa pasa lasa 
masa** se recordaba correctamente solo un 10 por ciento de las veces, en 
contraste con una secuencia no similar como agujero día vaca lápiz sopa***, que 
fue correcta el 80 por ciento de las veces. La similitud en el significado ( e.g. 
enorme grande largo ancho alto****) redujo el recuerdo en una cantidad 
significativa aunque muy pequeña (Baddeley, 1966a). 


Un patrón de resultados muy diferente surgió cuando se usó el mismo conjunto 
de palabras en un estudio de memoria a largo plazo, presentando una secuencia 
de diez ítems durante varios ensayos. Bajo estas circunstancias la similitud del 
significado dificultó el rendimiento, mientras que la similitud fonológica tuvo 


poco efecto (Baddeley, 1966b). Estos resultados eran consistentes con el uso de 
un almacén de base fonológica para el recuerdo inmediato de pequeñas 
cantidades de información, en contraste con el aprendizaje a largo plazo que, en 
línea con la posterior hipótesis de los niveles de procesamiento (Craick y 
Lockhart, 1972), parecía depender principalmente de la codificación semántica. 


Se asumió que el proceso de repaso se reflejaría en el efecto de la longitud de la 
palabra. La memoria inmediata de secuencias de palabras decaía a medida que 
las palabras se hacían más largas: mientras que la secuencia de cinco palabras 
cortas como wit, sum, pas, beg, top se recordaba correctamente el 90 por ciento 
de los ensayos, las secuencias polisilábicas como university, refrigerator, 
hippopotamus, tuberculosis, auditórium [universidad, refrigerador, hipopótamo, 
tuberculosis, auditorio] se recordaban alrededor del 50 por ciento (Baddeley et 
al., 1975). Este resultado era consistente con el supuesto de una huella que se 
desvanece junto con un proceso de repaso que opera en tiempo real. Se asumió, 
por tanto, que la amplitud de memoria está determinada por dos factores —la tasa 
a la que se desvanece la huella y la velocidad a la que pueden repasarse los 
ítems—. Las palabras más cortas se pueden repasar más rápidamente dando lugar 
a una amplitud mayor, y los sujetos que repasen rápidamente tienden a tener 
amplitudes más largas (Baddeley et al., 1975). Sin embargo, el proceso de repaso 
se puede bloquear pidiendo al sujeto que pronuncie de forma repetida un sonido 
irrelevante, como por ejemplo la palabra «la» (« the»). Aunque esto solo implica 
una carga mínima de memoria, impide el repaso y deteriora el rendimiento 
(Murray, 1968). 


Se añadió otro supuesto más, concretamente que los ítems presentados 
auditivamente ganaban un acceso automático al almacén fonológico, mientras 
que los presentados visualmente tenían que ser pronunciados subvocalmente 
para ganar el acceso. Este último punto se refleja en una interacción entre la 
similitud acústica, la modalidad de presentación y la supresión articulatoria. Este 
descubrimiento en cuestión contrasta con el efecto de similitud fonológica —que 
se supone que reside en el almacén- y con el efecto de longitud de palabra —que 
se supone que refleja el proceso de transferencia y de repaso—. Cuando se 
presenta el material visualmente, la supresión articulatoria a través de la 
repetición de una única palabra elimina tanto el efecto de similitud fonológica 
como el efecto de longitud de palabra. Esto se produce porque los ítems 
presentados visualmente no se pueden traducir fácilmente a un código 
fonológico apropiado. Sin embargo, cuando se presentan auditivamente el efecto 
de similitud fonológica reaparece (Murray, 1968; Levy, 1971), pero sigue sin 


aparecer el efecto de longitud de palabra. Esto ocurre porque los ítems auditivos 
ganan acceso automático al almacén. El efecto de longitud de palabra sigue sin 
aparecer porque depende directamente del repaso subvocal, el cual se impide 
mediante la supresión articulatoria (Baddeley et al. , 1975; Baddeley et al., 
1984a). 


Posteriormente, la distinción almacenamiento-repaso fue apoyada por pruebas 
neuropsicológicas de pacientes con lesiones que deterioraban, bien el 
almacenamiento, o bien el repaso (Vallar y Papagno, 2002), y por pruebas de 
neuroimagen que localizaban el componente de almacenamiento en la región 
temporo-parietal del hemisferio izquierdo, mientras que el repaso se localizó 
más frontalmente en el área de Broca (Paulesu et al. , 1993; Jonides, 1998). 


Como veremos en el Capítulo 3, el concepto del bucle fonológico se ha visto 
cuestionado. Sin embargo, como ilustra el Capítulo 2, a pesar del (o quizá 
gracias al) hecho de que esto continúa siendo un área de controversia teórica, ha 
demostrado ser muy fructífero para estimular la investigación sobre adquisición 
y procesamiento del lenguaje. Sin embargo, es importante tener cuenta que el 
bucle solo es un componente relativamente pequeño de la complejidad de 
sistemas y procesos que constituyen la memoria de trabajo. 


1.3.2, La agenda visoespacial 


Este sistema desempeña la misma función para la información visual y espacial 
que la que desempeña el bucle fonológico para estímulos verbales y acústicos. 
Mi propia implicación en el estudio de este sistema provino de una experiencia 
personal. Durante un año sabático en California, me empezó a interesar mucho el 
fútbol americano. En una ocasión, cuando conducía por la autopista desde Los 
Ángeles a San Diego, escuchaba el partido Stanford-UCLA por la radio, 
formándome una clara imagen del campo y de los equipos. Me di cuenta 
entonces de que conducía a la deriva de un carril a otro, cambié a una emisora de 
música, y sobreviví. 


De vuelta a Gran Bretaña, intenté simular experimentalmente mi experiencia. No 
teníamos acceso a un simulador de coches, y en su lugar usamos un rotor de 
persecución. Este incluía un punto de luz que seguía un camino circular, y 


pedíamos al sujeto que lo siguiera con una varilla. El nivel de dificultad se podía 
manipular variando la velocidad de rotación. Esta tarea de seguimiento se 
combinaba con diversas tareas de memoria, algunas incluían repasos verbales 
mecánicos, mientras que otras animaban al uso de imágenes. Por ejemplo, una 
de esas tareas usaba la clásica estrategia mnemotécnica de localizaciones, 
enseñando primero a los sujetos una ruta a través del campus que incluía varias 
localizaciones específicas. Después se les enseñaba a formar una imagen de cada 
una de las secuencias de objetos, una en cada localización, y a recuperarlas 
haciendo el camino mentalmente. Cuando esta tarea se realizaba sola, el 
rendimiento en el recuerdo aumentaba fiablemente en comparación con el repaso 
mecánico. Sin embargo, al realizarla junto con la tarea de seguimiento 
concurrente, la ventaja desaparecía, mientras que no tenía efecto sobre la 
memoria mecánica. Como veremos en los Capítulos 3 y 4, estudios posteriores 
han investigado la relación entre la MCP visual y las imágenes visuales, 
demostrando que es posible separar los aspectos visuales del sistema, 
relacionados con formas u objetos, de un componente espacial relacionado con 
la localización. Esta distinción ha sido apoyada por estudios de pacientes con un 
daño cerebral y por estudios sobre el funcionamiento normal del cerebro usando 
técnicas de neuroimagen (Jonides et al., 1993; Smith y Jonides, 1997; Della Sala 
y Logie, 2002). A diferencia del bucle, la agenda visoespacial depende 
principalmente del hemisferio derecho del cerebro. 


1.3.3. El ejecutivo central 


Nuestros estudios iniciales se interesaron casi exclusivamente por estos dos 
subsistemas, principalmente por aquellas bases que parecían ofrecer problemas 
más tratables. Sin embargo, al escribir un libro que trataba de resumir los 
progresos conseguidos en el modelo (Baddeley, 1986), llegué al último capítulo 
antes de darme cuenta de que no había dicho nada acerca del ejecutivo. Me 
propuse remediarlo, basando mis especulaciones en un modelo de control 
atencional propuesto por Norman y Shallice (1986) que, de forma poco usual, se 
preocupaba del control atencional de la acción, más que del papel de la atención 
en la percepción, sobre lo que ya había una serie de modelos bien desarrollados. 
Es significativo apuntar que el modelo de Norman y Shallice, que considero que 
continúa siendo extremadamente fructífero desde el punto de vista teórico, solo 


estaba disponible inicialmente como un informe técnico y posteriormente como 
capítulo de un libro, aparentemente por la dificultad para convencer a una revista 
de que lo aceptara (Shallice, comunicación personal). ¡Nuestro sistema de 
revisiones periódicas no parece favorecer la innovación! 


Tanto Norman como Shallice, estaban interesados en el control atencional de la 
acción, pero desde puntos de vista algo distintos. Norman estaba interesado en 
los errores de acción, y buscaba un marco de trabajo que proporcionara una 
posible explicación sobre por qué y cuándo podrían ocurrir. Esos lapsus son 
normalmente triviales, como cuando conduces de manera equivocada a la oficina 
en vez de al centro comercial un sábado por la mañana. Sin embargo, pueden ser 
ocasionalmente devastadores, por ejemplo, en accidentes aéreos debidos a 
errores del piloto. Shallice, por otro lado, estaba interesado en el control del 
comportamiento a través de los lóbulos frontales, y quería explicar el 
comportamiento paradójico de ciertos pacientes con daños bilaterales en los 
lóbulos frontales. Estos pacientes perseveran, realizando repetidamente la misma 
acción y mostrando considerables dificultades para escapar a dicho patrón. En 
otras ocasiones muestran un comportamiento aparentemente opuesto y cualquier 
estímulo consigue captar su atención. 


Para proporcionar un marco que explicara tanto los lapsus cotidianos como la 
actuación de los lóbulos frontales, Norman y Shallice propusieron que la 
conducta está controlada en dos niveles. Uno de ellos es relativamente 
automático, basado en hábitos y esquemas a través de los cuales sucesos 
predecibles dan lugar al comportamiento apropiado. Conducir por una ruta 
familiar podría ser un buen ejemplo de esto. El otro componente, que denominan 
Sistema Atencional Supervisor (SAS), es un mecanismo para anular esos 
hábitos. Se usa cuando los patrones de hábitos existentes ya no son adecuados, 
por ejemplo, encontrar un atasco y tener que llevar a cabo las acciones 
apropiadas para sortearlo. Los lapsus de atención cotidianos como dirigirte hacia 
el mercado un sábado por la mañana y encontrarte conduciendo de camino al 
trabajo, representan la dominancia inadecuada de esos patrones de hábitos por 
encima del control del SAS, y ocurren típicamente cuando la atención se distrae 
con la tarea que tienes entre manos —planificar unas vacaciones futuras, por 
ejemplo, en lugar de estar pensando en el actual viaje al centro comercial—. Se 
asume que los pacientes con daños en el lóbulo frontal tienen un trastorno del 
funcionamiento del SAS, con el resultado de que su atención puede ser captada 
por un único estímulo persistente o por una sucesión de estímulos irrelevantes en 
ausencia de control atencional central: su sistema de hábitos está preservado, 


mientras que el SAS frontalmente localizado no lo está. 


Propuse aceptar el modelo de Norman y Shallice como una base para 
conceptualizar el ejecutivo central (Baddeley, 1986). Como mostrarán los 
capítulos posteriores, continúo encontrando el modelo extremadamente útil. 


1.3.4. El búfer episódico 


El problema de tener un ejecutivo que comprende una capacidad general de 
procesamiento es que es potencialmente capaz de explicar cualquier resultado. 
Esta excesiva flexibilidad no es empíricamente productiva para generar 
experimentos que nos digan algo más sobre cómo funciona el sistema. En un 
intento de remediar este problema, me propuse explorar la posibilidad de que el 
ejecutivo tuviera un papel puramente atencional, y que en sí mismo fuera 
incapaz de almacenar (Baddeley, 1993; Baddeley y Logie, 1999). Esto condujo a 
una serie de estudios que intentaban fraccionar el ejecutivo en una alianza de 
procesos de control atencional separados, cada uno realizando una función 
diferente. Como muestra el Capítulo 7, esto resultó ser una tarea difícil, aunque 
no sin éxito. 


Sin embargo, cada vez estaba más claro que se necesitaba alguna forma de 
almacenamiento adicional si el modelo tenía que explicar adecuadamente 
algunas de las funciones más complejas de la memoria de trabajo, como la 
capacidad para recordar largos pasajes en prosa. Además, la investigación sobre 
las diferencias individuales en el rendimiento de la memoria de trabajo estaba 
proporcionando algunos resultados muy sorprendentes. La medida utilizada en 
estos estudios era la amplitud de memoria de trabajo. Esto requería que los 
sujetos combinaran memoria con procesamiento, por ejemplo, comprobar una 
secuencia de frases y luego recordar la última palabra de cada una (Daneman y 
Carpenter, 1980). La amplitud se midió a través del máximo número de frases 
que el sujeto podía procesar y recordar con éxito. La amplitud de memoria de 
trabajo predice una amplia variedad de actividades cognitivas complejas, desde 
la comprensión hasta la programación de ordenadores (Daneman y Merikle, 
1996; Engle et al., 1999a). 


Por una parte, el éxito de esta compleja medida de amplitud fue muy 


gratificante, ya que ilustra la extensión y utilidad del concepto general de 
memoria de trabajo. Sin embargo, por otro lado, no era fácil ver cómo el 
rendimiento en esas complejas tareas de amplitud podía explicarse dentro del 
marco existente, en el que el almacenamiento de memoria estaba limitado al 
bucle y a la agenda, cada uno de los cuales podía mantener la información solo 
brevemente, y en los que no se había especificado ninguna forma de interacción. 
Esto propició la suma de un cuarto componente, el búfer episódico (Baddeley, 
2000). Se asumió que este sistema formaba una interfaz entre los tres 
subsistemas de la memoria de trabajo y la memoria a largo plazo. Servía como 
un mecanismo de enlace que permitía que la información perceptiva, la 
procedente de los subsistemas y la de la memoria a largo plazo se integraran en 
un número limitado de episodios. Era un búfer en el sentido de que 
proporcionaba una interfaz entre varios códigos diferentes —visual, verbal, 
perceptivo— y la MLP, semántica y episódica. Finalmente, se supuso que era 
accesible a través de la conciencia. Se diferencia de la MLP episódica en su 
naturaleza temporal, pero proporciona una interfaz que permite el acceso a la 
MLP tanto para el aprendizaje como para la recuperación. Se supuso que actuaba 
como un espacio de trabajo en el que la conciencia juega un papel crucial (ver 
Capítulo 13). Como tal, proporciona una conexión conceptual entre el modelo de 
Baddeley y Hitch y otra serie de aproximaciones a la memoria de trabajo 
(Miyake y Shah, 1999a). El búfer episódico se discute con más detalle en los 
Capítulos 8 y 9. 


1.4. Conclusiones 


El modelo multicomponente de memoria de trabajo asume un sistema de cuatro 
componentes, que incluyen (1) un controlador atencional, el ejecutivo central, y 
tres sistemas temporales de almacenamiento, concretamente, (2) la agenda 
visoespacial, (3) el bucle fonológico, (4) y un sistema de almacenamiento 
integrado más general, el búfer episódico. Los capítulos que siguen tratan tanto 
de dar cuenta del modelo de una manera más detallada, así como de situarlo en 
un contexto más amplio. La investigación en esta área se ha desarrollado 
enormemente desde que se propuso el modelo hace más de 30 años, con el 
resultado de que la explicación proporcionada será inevitablemente selectiva, y 
determinada por mi punto de vista personal sobre el tema. Sin embargo, he 


intentado dar a conocer aproximaciones alternativas, proporcionando referencias 
que permitirán explorar esas aproximaciones, explicando por qué mantengo mis 
puntos de vista, que, por supuesto, están continuamente evolucionando a medida 
que aprendemos más sobre la memoria de trabajo. 


A medida que progresa el libro, intento situar el modelo multicomponente más 
detallado y basado empíricamente en un contexto teórico más amplio. En un 
intento de explicar dónde, cuándo y por qué es importante la memoria de trabajo, 
estoy dispuesto a discutir al menos brevemente aquellas situaciones en las que 
juega un pequeño papel. Como resultado, los capítulos finales son 
considerablemente más amplios de miras y de un tono más especulativo de lo 
que anticipé cuando comencé con lo que originariamente estaba planificado 
como un amplio ensayo del estado actual del modelo multicomponente. 


Notas al pie 


guardan mayor parecido entre sí que las Letras k 77 w y IdbOlju: /, y /wal/, N. 
de la T. 


** En inglés man cat cap map can [hombre, gato, mapa, lata]. N. de la T. 
*** En inglés pit day cow pen soup. N. de la T. 


**** En inglés: e.g. huge big long wide tall. N. de la T. 


CAPÍTULO 2 


¿Por qué necesitamos al bucle 


fonológico? 


A pesar de que el bucle fonológico tiene una capacidad limitada a unos pocos 
ítems y que solo se utiliza en determinadas circunstancias, ha generado una gran 
cantidad de investigación a lo largo de los últimos 30 años. También parece ser 
el componente de la memoria de trabajo más fuertemente asociado al modelo de 
Baddeley y Hitch, como resultado, los datos que no se ajustan al componente del 
bucle fonológico se citan a menudo erróneamente como evidencia en contra del 
modelo multicomponente. 


Más adelante discutiré en detalle un ejemplo sobre esto. 


La cantidad de trabajo que ha generado, y el hecho de que siga siendo 
controvertido y a la vez empíricamente productivo después de 30 años, plantea 
un dilema. Dedicar un único capitulo al bucle significaría inevitablemente pasar 
por encima de controversias que continúan activas y desdeñar hipótesis 
alternativas. Por otro lado, un tratamiento profundo implicaría probablemente un 
grado de detalle que sería desproporcionado respecto al resto del libro. De 
hecho, hay quien puede considerar este sistema como de escasa importancia, tal 
como describió Jim Reason muy coloridamente (comunicación personal) como 
poco más que «un grano en la cara de la psicología cognitiva». Si este es el caso, 
entonces sería difícil justificar un tratamiento más exhaustivo. Comenzaré por 
tanto discutiendo la cuestión acerca de qué función podría desempeñar el bucle 
fonológico. Se continuará con un capítulo que intenta resumir las controversias y 
proporciona una breve explicación de las formas en las que el modelo del bucle 
ha sido elaborado y desarrollado. 


2.1. La relevancia evolutiva del bucle 


En los días en los que se suponía que la amplitud de dígitos era una buena 
medida de la MCP, se podría justificar fácilmente el estudio del bucle como 
reflejo de la capacidad de una memoria de trabajo general (Atckinson y Shiffrin, 
1968). Sin embargo, como se ha mencionado antes, los pacientes cuya amplitud 
era de un solo dígito parecían tener pocos problemas en su vida diaria, lo que 
parece claramente inconsistente con un deterioro de la memoria de trabajo 
general. Si la amplitud de dígitos, y, por tanto, el bucle fonológico, no refleja un 
sistema general de memoria de trabajo, ¿qué función biológica desempeñaría? 


2.1.1. Comprensión del lenguaje 


La posibilidad de trabajar con PV, una paciente con un déficit muy puro en la 
memoria fonológica a corto plazo, nos ofreció una oportunidad para enfrentarnos 
a esta cuestión (Vallar y Baddeley, 1984). Mi colega Giuseppe Vallar y yo 
comenzamos explorando la posibilidad de que el bucle pudiera jugar un papel 
importante en la comprensión del lenguaje (Vallar y Baddeley, 1987). 
Encontramos que PV no tenía dificultades para procesar frases simples, pero sí 
que mostraba un déficit en la capacidad para verificar ciertas frases complejas. 
Estas frases se formaron de forma que la paciente tenía que mantener la parte 
inicial de la frase hasta el final de la misma, antes de poder tomar la decisión de 
verificación. Por tanto, ella podía rechazar con éxito frases cortas como Los 
marineros son habitados por barcos, y aceptar la inversa ( Los barcos son 
habitados por marineros), pero prácticamente actuaba al azar con versiones más 
largas, como A menudo se cree, y con considerable justificación, que los barcos 
son habitados por marineros. Este problema para procesar y comprender frases 
largas es característico de los pacientes con un déficit de la MCP (Vallar y 
Shallice, 1990). Sin embargo, es difícil argumentar convincentemente que la 
capacidad para interpretar estas enrevesadas frases haya supuesto una ventaja 
biológica lo suficientemente grande como para justificar la evolución de un 
sistema aparentemente especializado como es el bucle fonológico. 


2.2. Adquisición del lenguaje 


Nuestra segunda hipótesis fue que el bucle posiblemente jugara un papel 
importante en el aprendizaje del lenguaje, convirtiéndose en un componente 
crucial para los niños, pero no tanto para los adultos que ya hubieran adquirido 
su lengua nativa. Algo de apoyo a esta perspectiva venía de la observación de 
que los niños disléxicos, que a menudo tienen un retraso en el desarrollo del 
lenguaje, muestran frecuentemente una amplitud de dígitos deteriorada (Miles, 
1993). Decidimos poner a prueba esta hipótesis pidiéndole a PV que aprendiera 
ítems del vocabulario de una lengua extranjera, el ruso (Baddeley et al. , 1988). 
Si el bucle fonológico juega un papel importante en la adquisición del lenguaje, 
ella debería mostrar un rendimiento pobre en esta tarea de aprendizaje 
fonológico a largo plazo. 


2.2.1. Evidencia de pacientes 


Nuestra prueba simplemente incluía ocho palabras italianas y las ocho 
equivalentes rusas, por ejemplo, cuando se presentaba la palabra familiar italiana 
rosa (rosa), PV tenía que aprender a responder con la palabra rusa svieti. Para 
controlar un posible déficit general para el aprendizaje verbal, también le 
pedimos que aprendiera ocho pares de palabras en su lengua nativa italiana, por 
ejemplo, asociar cavallo (caballo) y tavola (mesa). También examinamos a un 
grupo control de sujetos análogos en edad y nivel educativo. PV demostró tener 
una capacidad normal para aprender a asociar pares de palabras italianas, una 
tarea que se sabe que depende principalmente de la codificación semántica, pero 
en diez ensayos sucesivos fue completamente incapaz de dominar ni una sola 
palabra del vocabulario ruso, mientras que a esas alturas los sujetos control ya 
habían aprendido las ocho. Tenía, por tanto, un problema para el aprendizaje 
fonológico nuevo. 


Un estudio posterior basado en un estadounidense muy inteligente estudiante de 
licenciatura amplió este hallazgo a una cuestión de desarrollo de la MCP, que se 
identificó gracias a que tenía una MCP fonológica muy pobre. Al igual que PV, 
mostró una adquisición normal de pares de palabras junto con un aprendizaje 
muy pobre para el vocabulario de una lengua extranjera (Baddeley, 1993). 


Posteriormente descubrimos que había tenido enormes dificultades previas para 
el aprendizaje de una segunda lengua. 


Vallar y Papagno (1993) describen a un sujeto con síndrome de Down que 
muestra lo contrario. A pesar de su reducido nivel de inteligencia general, ella 
dominaba con fluidez tres idiomas. Demostró tener una memoria fonológica a 
corto plazo excelente, en lugar del deterioro en MCP que es típico del síndrome 
de Down (Bellugi et al. , 1994; Jarrold et al. , 1999). En la misma línea, un 
estudio con políglotas que dominaban con fluidez varios idiomas, mostró que 
todos tenían amplitudes de dígitos más grandes que los sujetos control 
monolingúes, que por otra parte eran similares en cuanto a edad y nivel 
educativo (Papagno y Vallar, 1995). 


2.2.2. Aprendizaje de la segunda lengua 


Las pruebas descritas hasta ahora se basan en datos procedentes de casos 
excepcionales en los que el bucle fonológico está específicamente deteriorado, o 
bien está preservado a pesar de existir un déficit cognitivo más general. Una 
segunda aproximación al tema estudió el impacto en el aprendizaje de 
vocabulario nuevo de la interrupción del procesamiento fonológico en sujetos 
normales. Papagno et al. (1991) interrumpieron el funcionamiento del bucle 
fonológico de sus sujetos mediante la supresión articulatoria, solicitando de 
manera continuada la repetición de una expresión, y bloqueando así el repaso. 
Esto deterioraba la adquisición de vocabulario de una lengua extranjera, 
mientras que tenía poco impacto sobre el aprendizaje de pares asociados en su 
lengua nativa. Papagno y Vallar (1992) proporcionaron más pruebas de la 
importancia del bucle fonológico en el aprendizaje de una lengua extranjera, al 
demostrar que este se veía deteriorado por dos variables con una gran influencia 
en las operaciones del bucle, a saber, la similitud fonológica y la longitud de 
palabra. A pesar de su interferencia con el aprendizaje de vocabulario de una 
lengua extranjera, ninguna de estas dos variables fonológicas afectó a la tasa de 
aprendizaje de pares de palabras en la lengua nativa, lo que sugería de nuevo que 
el aprendizaje de nuevas formas fonológicas depende del bucle. 


2.2.3. Niños con deterioro del lenguaje 


Todo el trabajo descrito hasta el momento se ha referido a la capacidad para 
aprender una segunda lengua; la cuestión de si el bucle fonológico influye en la 
adquisición de la lengua nativa es por supuesto de una mayor importancia 
biológica. Susan Gathercole y yo, comenzamos a investigar esta cuestión 
empleando una muestra de niños diagnosticados con un trastorno específico del 
lenguaje (SLI). Poseían una edad media de ocho años y una inteligencia no 
verbal normal, pero su nivel de desarrollo del lenguaje se correspondía con el de 
un niño de seis años. Les administramos una batería de tests de memoria verbal, 
y encontramos que tenían un déficit particularmente marcado en su capacidad 
para repetir no-palabras típicamente monosilábicas como wux o pij. 
Desarrollamos un test de repetición de no-palabras más amplio, que, en su 
versión final, incluía ítems que variaban en un rango de dos sílabas (e.g., ballop) 
a Cinco (e.g., pristoractional) (Gathercole y Baddeley, 1990). Se pronunciaban 
las no-palabras al niño, y se le pedía que las repitiera. Comparamos nuestro 
grupo de niños con SLI con niños de edad e inteligencia no verbal similares, y 
también con niños de seis años cuyo nivel de desarrollo del lenguaje era 
equiparable al de los niños de ocho años con SLI. 


Los niños con SLI presentaron un deterioro sustancial en la repetición de no- 
palabras, incluso cuando se les comparó con los niños de seis años, puntuando a 
un nivel que posteriormente demostró ser el apropiado para niños de cuatro años 
(Gathercole y Baddeley, 1990). Fuimos capaces de descartar problemas de 
escucha o de articulación, y sugerimos que nuestra prueba proporcionaba una 
medida de la capacidad del bucle fonológico, que era incluso más apropiada que 
la amplitud de dígitos para predecir la adquisición del lenguaje, ya que 
demandaba el procesamiento de ítems que se parecían a palabras reales. 
Supusimos que la amplitud de dígitos dependería del mismo sistema, pero que 
probablemente dependería más del conocimiento existente de dígitos, sobre el 
que nuestros niños con SLI habrían tenido dos años más de experiencia que los 
niños del grupo control equiparados en lenguaje. Como veremos más adelante, 
nuestra corazonada fue correcta, ya que la repetición de no-palabras y la 
amplitud de dígitos tendieron a correlacionar, aunque la repetición de no- 
palabras (NWR*) demostró ser un mejor predictor de la adquisición del lenguaje 
(Baddeley et al., 1998a). 


2.2.4, Adquisición del vocabulario en niños normales 


También investigábamos hasta qué punto nuestra nueva prueba era capaz de 
predecir el nivel de vocabulario en niños normales (Gathercole y Baddeley, 
1989). Nuestro diseño básico implicaba examinar a una serie de niños de una 
determinada edad, midiendo la repetición de no-palabras, la inteligencia no 
verbal a través del test de Matrices de Raven y el nivel de vocabulario. Este se 
midió utilizando la Escala Británica de Vocabulario Pictórico (BPVS) en la que 
se pronuncia una palabra mientras el niño observa un conjunto de cuatro dibujos, 
y se le pide que señale el ítem especificado. Mientras que el CI no verbal 
correlacionó con el vocabulario a la edad de 4 ( r = 0,388) y 5 años ( r = 0,164), 
la repetición de no-palabras se asoció más fuertemente con el nivel de 
vocabulario ( r = 0,525 y 0,492, respectivamente). Esta correlación ya se ha 
replicado muchas veces a través de varios grupos de edad diferentes (ver Tabla 
21): 


Por supuesto, la correlación no implica necesariamente causalidad. Por ejemplo, 
podría argumentarse plausiblemente que los sujetos con un gran vocabulario son 
capaces de usar este conocimiento para mejorar su rendimiento en tareas de no- 
palabras. Además, la observación de Papagno y Vallar (1995) de que los 
políglotas que hablan diferentes lenguas tienen amplitudes de dígitos mayores, 
podría reflejar el hecho de que el bucle se puede servir de hábitos de lenguaje 
más extensos adquiridos en el aprendizaje de lenguas no nativas. Este enfoque 
fue propugnado por Brown y Hulme (1996), quienes propusieron que un buen 
vocabulario daba lugar a una buena memoria verbal más que a la inversa. El 
apoyo a este enfoque provino de un estudio de Gathercole (1995) sobre el 
rendimiento en niños con puntuaciones altas o bajas en la prueba de repetición 
de no-palabras. Ella comparó el rendimiento con ítems similares al inglés en su 
estructura fonética, como prindle y contramponist, con el rendimiento en ítems 
menos parecidos, como ballop y skiticult. Tanto el grupo de repetición de no- 
palabras alto como el bajo obtuvieron una ventaja clara y ampliamente 
equivalente de la similitud en las palabras, apoyando fuertemente la idea de que 
los hábitos de lenguaje contribuyen al rendimiento en la repetición de no- 
palabras. 


Tabla 2.1. La relación entre vocabulario, repetición de no-palabras y 
amplitud de dígitos. Datos procedentes de una serie de estudios referidos 
por Baddeley, Gathercole y Papagno (1998) 


Edad media n Repetición de no-palabras Amplitud de dígitos 
Simple Parcial* Simple Parcial* 


3,00 4,01 4,07 4,09 5,03 5,06 5,07 5,09 5,09 6,07 8,07 13,1043 70 80 57 70 48 8l 


* Con otros predictores potenciales eliminados estadísticamente. 


Sin embargo, una segunda característica de los datos de Gathercole cuenta una 
historia algo distinta. Cuando se registró la adquisición de vocabulario de los 
niños a lo largo de un año a través de esta prueba demostró no tener relación con 
el rendimiento con ítems parecidos a palabras, pero sí correlacionó claramente 
con la capacidad del niño para repetir secuencias menos parecidas. Parece 
probable, por tanto, que haya dos contribuciones a la repetición de no-palabras, 
una procedente de los hábitos de lenguaje existentes, lo que contribuye de 
manera ampliamente equivalente en los dos grupos, y la otra procedente de una 
fuente que difiere entre los dos grupos. Yo sugiero que esto constituye la 
capacidad limitada del almacén fonológico. Los hábitos de lenguaje 
proporcionan un buen apoyo para ambos grupos, pero el aprendizaje nuevo 
depende de la capacidad del almacén fonológico: los niños con un almacén 
fonológico de mayor capacidad serán capaces de mantener las palabras nuevas 
durante más tiempo, incrementando la probabilidad del aprendizaje fonológico a 
largo plazo. 


Más pruebas de la primacía del almacén fonológico provinieron de un estudio en 
el que se usó la correlación cruzada para arrojar algo de luz sobre el nexo causal 
entre el vocabulario existente, la repetición de no-palabras y la capacidad para 
adquirir palabras nuevas (Gathercole y Baddeley, 1989). Se examinó a un grupo 
de niños de cuatro años tanto en vocabulario como en repetición de no-palabras, 
y se les volvió a examinar a los cinco. Utilizando la lógica de la correlación 
cruzada, se planteó que si la fuerza conductora primaria era la memoria 
fonológica, entonces la repetición de no-palabras a los cuatro años de edad 
predeciría el vocabulario un año después significativamente mejor que el 
vocabulario con cuatro años predeciría la memoria a los cinco. Por otro lado, si 
el vocabulario fuera el factor conductor, debería ocurrir el patrón contrario. Los 
resultados fueron claros al indicar que la repetición de no-palabras predijo la 
adquisición del vocabulario posterior y no al revés, aunque a medida que los 
niños se hacen mayores, el patrón se hace más recíproco y tanto la repetición de 
no- palabras como el vocabulario predicen el rendimiento posterior (Baddeley et 
al. , 1998a). 


Inevitablemente, será difícil organizar nexos causales claros en el desarrollo 


cognitivo, porque es probable que se estén desarrollando en paralelo toda una 
serie de habilidades cognitivas, dificultando la separación entre unas y otras —el 
problema de la colinealidad—. El tema se complica más por la tendencia del 
desarrollo cognitivo a incluir procesos cíclicos a través de los cuales una 
capacidad inicial da lugar al desarrollo de habilidades cognitivas, que luego 
fomentan más esa capacidad, que a su vez vuelve a fomentar el desarrollo de las 
habilidades. Esto ha dado lugar a explicaciones alternativas acerca de nuestros 
hallazgos, en términos de procesamiento fonológico más que de bucle 
fonológico (Snowling et al. , 1991, pero ver Gathercole et al. , 1991). Mientras 
que se podría defender un déficit del procesamiento fonológico no especificado 
como explicación de los resultados del SLI de los niños, la interpretación de 
Snowling et al. no puede explicar fácilmente nuestros datos procedentes de 
adultos que adquieren una segunda lengua. Por ejemplo, es poco plausible 
sugerir que el dramático deterioro de PV en la MCP fonológica resulte de una 
pérdida del hábito del lenguaje en general, dado que no tiene deteriorado el 
vocabulario ni la sintaxis, y habla con una prosodia y una velocidad 
perfectamente normales (Basso et al. , 1982). Del mismo modo, mientras que la 
supresión articulatoria, la longitud de palabra y la similitud fonológica, influyen 
todas en el bucle fonológico y todas interfieren en la adquisición de vocabulario 
nuevo, es complicado considerar a cualquiera de ellas como la responsable de 
tener un acceso temporalmente anulado a los hábitos de lenguaje. 


2.2.5. Adquisición de la sintaxis 


La evidencia acerca del papel del bucle fonológico en la adquisición de la 
gramática es menor que sobre el aprendizaje de vocabulario. Se ha propuesto 
que la capacidad para almacenar secuencias de palabras juega un papel 
importante en el desarrollo sintáctico (Nelson, 1987; Plunkett y Marchman, 
1993), una perspectiva apoyada por el estudio de dos hermanos bilingúes de 
Speidel (1993). Los dos tenían una alta capacidad de inteligencia general, pero 
uno era más lento para adquirir palabras individuales y cometía múltiples errores 
sintácticos, junto con una memoria fonológica pobre. Daneman y Case (1981) 
demostraron que la amplitud de palabras era mejor predictora del rendimiento en 
una tarea artificial de aprendizaje de la gramática que la edad cronológica. Los 
estudios de Blake et al. (1994) y de Adams y Gathercole (1995; 1996) 


demostraron que las pruebas de memoria fonológica eran capaces de predecir la 
longitud media de las expresiones de lenguaje habladas, mientras que Ellis y 
Beaton (1993) implicaban a la memoria fonológica en la adquisición de la 
gramática cuando se aprende una segunda lengua. Nosotros sugerimos, por 
tanto, que, sopesando las pruebas, apoyaríamos la idea de que el bucle 
fonológico juega un papel importante en la adquisición tanto de la lengua nativa 
como de una segunda lengua, una perspectiva que se discute con detalle en 
Baddeley et al. (1998a). 


2.3. Memoria a corto plazo subléxica 


Como hemos visto, la clásica tarea de MCP es la tarea de amplitud de dígitos, en 
la que los sujetos recuerdan una secuencia de dígitos, que son ítems muy 
sobreaprendidos y que proceden de un conjunto muy restringido. 
Trasladándonos a la amplitud de palabras, ha existido la tendencia, ciertamente 
por mi parte, de mantener el uso repetido de un conjunto limitado de palabras, 
para acentuar explícitamente la necesidad de almacenar en orden serial y para 
minimizar cualquier contribución de la memoria a largo plazo. Esta versión 
clásica de la MCP serial ha demostrado ser de hecho una tarea 
sorprendentemente compleja y empíricamente fructífera, pero si, como sugirió 
Baddeley et al. (1998a), el bucle fonológico ha evolucionado para ayudar a 
adquirir secuencias fonológicas novedosas, entonces parece paradójico estudiar 
el proceso utilizando componentes como los dígitos, que ya están muy 
sobreaprendidos. Por esta razón, mis colegas han comenzado a alejarse del 
estudio de conjuntos cerrados de ítems bien aprendidos y se han dirigido hacia el 
estudio de no-palabras, produciendo resultados que, como veremos, retan y 
extienden los modelos existentes del bucle fonológico. El trabajo se centra en 
dos temas: un detallado análisis de los patrones de errores, junto con un análisis 
de los procesos por los cuales el recuerdo se ve influido por la lexicalidad, esto 
es, si lo que se tiene que recordar son palabras o no-palabras. 


2.3.1. Patrones de errores de palabras y no-palabras 


El análisis detallado de los errores ha constituido una importante herramienta 
para desarrollar y examinar los modelos de MCP desde sus primeros días 
(Conrad, 1960 1964; Sperling y Speelman 1970). Por ejemplo, cualquier modelo 
concreto sobre la amplitud de dígitos debería ser capaz de tener en cuenta la 
observación de que cuando la longitud de una secuencia excede la amplitud, los 
sujetos típicamente continúan recordando la mayoría de los ítems, pero lo hacen 
en un orden incorrecto. Estos errores tienden a oscilar en distancias 
relativamente cortas dentro de la secuencia, siendo más probables las 
transposiciones adyacentes (e.g., 1, 2,3, 4,5,6a1, 2, 3, 5, 4, 6) cuando se 
recuerdan todos los ítems (Aaronson, 1968; Bjork y Healey, 1974; Lee y Estes, 
1997). El hecho de que los errores se den entre ítems adyacentes sugiere que, 
aunque la información acerca del orden se pueda haber vuelto menos exacta, no 
se ha perdido totalmente. 


Sin embargo, un estudio sobre la retención de no-palabras consonante — vocal — 
consonante (CVC) de Trieman y Danis (1988) produjo un cuadro algo distinto. 
En este caso, predominaban lo que parecían ser errores en los ítems: esto es, se 
producían CVCs que no se habían presentado en la secuencia. Sin embargo, un 
análisis más detallado indicó que estos aparentes errores en los propios ítems 
eran el resultado de errores en el orden dentro de la secuencia de fonemas, por 
tanto, wux cCaz podría convertirse en cux waz. Por tanto, uno podría redescribir 
los aparentes errores en los ítems como errores en el orden, como resultado de 
que las consonantes y las vocales se lleguen a «despegar» en las nuevas CVCs. 
De nuevo, las transposiciones ocurrían a lo largo de distancias relativamente 
cortas, lo que implicaba que algo de información acerca del orden se continuaba 
almacenando. 


Gathercole et al. (1999) estudiaron el recuerdo serial de CVCs que variaban en la 
frecuencia fonémica, esto es, en la probabilidad de que se diera esa combinación 
de fonemas en el lenguaje. Los ítems de alta frecuencia fonética se recordaban 
mejor que los compuestos por secuencias de sonidos menos familiares. Al igual 
que Trieman y Danis, ellos encontraron que los errores se debían 
predominantemente a migraciones de fonemas individuales, más que 
migraciones de sílabas completas de CVCGs. Los errores en el orden se atribuían 
predominantemente a las consonantes, siendo sustancialmente más importante la 
retención de la información acerca del orden de las vocales. Ellos sugieren que la 
retención de la información sobre el orden depende principalmente de las 


vocales, cuyo recuerdo había demostrado ser a lo largo de numerosos estudios 
más fiable que el de las consonantes. Por ejemplo, Drewnowski (1980) demostró 
que la similitud en el sonido vocal a lo largo de los ítems (e.g., dah, fah, gah) 
daba lugar a un recuerdo más pobre que la similitud de las consonantes (e.g., dih, 
dah, doh), sugiriendo que las vocales juegan un papel más central en la MCP. 


Este patrón de resultados es consistente con la hipótesis de que la información 
sobre el orden recae principalmente en los sonidos vocales, estando las 
consonantes más o menos fuertemente ligadas a las vocales individuales. En el 
caso de un conjunto limitado y cerrado de ítems fonológicamente distintos, como 
los dígitos o las consonantes no similares, retener el orden de las vocales es 
suficiente para permitir la regeneración sin ambigiúedades de la cadena original, 
en contraste con una lista fonológicamente similar, en la que la vocal común 
proporcionaría una pista relativamente ineficaz. Esta interpretación del efecto de 
similitud fonológica es común a un número de modelos computacionales 
descritos posteriormente, los cuales separan el almacenamiento acerca de la 
información sobre el orden de una etapa posterior de selección del ítem. Este 
proceso se puede modelar de manera relativamente fácil cuando los ítems ya 
existen en algún lexicón a largo plazo, como en el caso de los dígitos y las 
palabras, pero supone más de un problema cuando, como en el caso presente, los 
sujetos tienen que recuperar no-palabras nuevas. 


2.3.2. Lexicalidad y redintegración 


Gathercole y sus colegas encontraron que la capacidad para repetir no-palabras 
era una buena predictora de la probabilidad de que un niño tuviera o no 
problemas de lectura (Baddeley y Gathercole, 1992; Gathercole y Pickering, 
2001). Sin embargo, aunque esto podría reflejar un fallo de memoria, el 
problema podría ser el resultado plausible de una dificultad, bien para escuchar, 
bien para articular el material. Si el problema fuera que no oyen, entonces los 
errores se producirían incluso en secuencias cortas cuando la presentación es 
auditiva, lo que permitiría detectar esta posibilidad y que el oído del niño fuera 
examinado audiométricamente. Las complicaciones en la producción del habla 
también podrían evitarse utilizando el reconocimiento, más que el recuerdo 
hablado; el niño escucha dos secuencias de no-palabras que varían en longitud, y 


detecta si el orden de los sonidos que las componen era el mismo o era diferente. 
Esto, sin embargo, suscita la cuestión adicional acerca de si la medida de 
reconocimiento de no-palabras pudiera ser comparable a las tareas de recuerdo 
existentes como predictoras de la adquisición de vocabulario. 


2.3.3. Lexicalidad y reconocimiento 


Gathercole et al. (2001) investigaron esto midiendo la amplitud tanto del 
recuerdo como del reconocimiento para palabras y no-palabras. Su 
procedimiento consistía en lo siguiente: en la tarea de recuerdo, los sujetos 
escucharían e intentarían repetir secuencias de palabras monosilábicas o de no- 
palabras de frecuencia fonética equivalente. La longitud de la secuencia se 
incrementaba hasta el punto en que el recuerdo correcto fracasaba, ¡.e., con una 
longitud igual a la amplitud para ese tipo de material. El reconocimiento se 
midió presentando secuencias de longitud creciente, cada una seguida de una 
segunda secuencia que, o bien era idéntica, o bien cambiaba el orden de dos 
ítems (e.g., se presenta pig, hat, rug, day [cerdo, sombrero, alfombrilla, día]; se 
pide pig, rug, hat, day). Encontraron que se recordaban sustancialmente mejor 
las palabras que las no-palabras. Sin embargo, sorprendentemente, encontraron 
que cuando se empleaba el reconocimiento, había poca diferencia en cuanto a la 
amplitud para las palabras y las no-palabras. Este resultado fue replicado a lo 
largo de una serie de estudios por Gathercole et al. (2001), y fue más ampliado 
por Thorn y Gathercole (1999) en un estudio en el que se comparaba la amplitud 
en sujetos monolingúes y bilingies para palabras en su primera o segunda 
lengua. Encontraron una clara ventaja cuando el material estaba en la primera 
lengua del sujeto al medirlo mediante recuerdo, mientras que el tipo de lengua 
tuvo poco efecto en el reconocimiento. 


Volviendo al tema práctico que propició el estudio inicial, afortunadamente, se 
demostró que el reconocimiento de no-palabras correlacionaba con la 
adquisición de vocabulario (Gathercole et al. , 2001), lo que sugiere que esto 
proporcionará una útil y práctica herramienta para examinar a niños con 
problemas en la producción del habla. Este resultado también implica que lo que 
proporciona el poder predictivo de la repetición de no-palabras es la capacidad 
para almacenar información fonológica nueva, más que el conocimiento 


existente del lenguaje, al menos durante las primeras etapas de la adquisición del 
lenguaje, y como tal, refuerza las conclusiones previas de Baddeley et al. 
(1998a) respecto al papel del almacén fonológico en la adquisición del lenguaje. 


2.3.4. El tamaño del conjunto y el recuerdo 


Antes de intentar reunir las pruebas y considerar sus implicaciones para el 
modelo del bucle fonológico se describirá un último estudio. En este estudio, 
Gathercole (en preparación) manipuló una variable importante que distingue 
entre el procedimiento de amplitud de memoria estándar y la repetición de no- 
palabras, concretamente se distingue entre usar repetidamente un limitado 
conjunto «cerrado» de ítems, por ejemplo, con las mismas diez palabras, o por el 
contrario usar un conjunto «abierto», con palabras distintas para cada ensayo. Tal 
como ella esperaba, encontró una ventaja del conjunto cerrado, en el que el 
limitado rango de palabras facilitó mucho más el recuerdo de los ítems. Sin 
embargo, fue más relevante el patrón de errores obtenido. Encontró que el 
conjunto cerrado de palabras se comportaba justo igual que los dígitos, los 
errores típicamente reflejaban una transposición del orden en que se recordaban 
las palabras, con una escasa tendencia a recordar las palabras incorrectamente. 


En contraste, las palabras de los conjuntos abiertos a menudo se recordaron 
incorrectamente. Un análisis más detallado demostró que esto era el resultado de 
la tendencia de las consonantes a cambiar su posición serial. Como en el caso de 
las no-palabras, el patrón típico consistió en la migración de las consonantes a 
posiciones adyacentes, por ejemplo, hat-pen a pat-hen. Combinando los 
resultados de este estudio y el de Gathercole et al. (2001), ella propuso que la 
información sobre el orden se almacenaba a un nivel subléxico, utilizándose el 
conocimiento léxico en la etapa de recuerdo posterior, donde a menudo se 
denomina redintegración al conocimiento a largo plazo usado para facilitar el 
recuerdo (Schweikert, 1993; Brown y Hulme, 1995). Cuando se reutiliza 
constantemente un limitado conjunto de palabras, el rango de posibles 
candidatos a emparejarse con una huella de memoria degradada está altamente 
constreñido, dando lugar a un rendimiento mejor. Sin embargo, cuando se 
emplea un conjunto abierto de muchas palabras CVC potenciales, la capacidad 
de redintegración correcta se reduce sustancialmente: aunque posiblemente se 


sepa que todos los ítems son palabras reales, esto es menos útil, ya que hay un 
gran número de posibles ítems CVC que son palabras reales y, por tanto, buenos 
candidatos para el recuerdo. 


Si el recuerdo de la información sobre el orden depende principalmente de la 
retención de la secuencia de sonidos vocales, las listas fonológicamente 
similares que tengan una vocal común se beneficiarán poco de este proceso de 
redintegración, ya que la información retenida no diferenciará entre posibles 
respuestas candidatas. Este parece ser el caso, sin importar si la memoria se mide 
mediante recuerdo o si se mide mediante reconocimiento, como de hecho es el 
caso (Gathercole et al. , 2001). La redintegración podría ocurrir en cualquiera de 
los niveles, o en ambos. Uno implica el uso automático del conocimiento del 
lenguaje para acentuar la codificación y/o la recuperación de la información 
dentro del bucle fonológico, un proceso análogo al reconocimiento de patrones. 
El otro podría incluir el uso intencional de conocimiento basado en el lenguaje o 
de otro conocimiento, para interpretar la evidencia incompleta en el proceso 
activo de recuperación. El primer proceso automático debería acentuar el 
recuerdo de palabras sobre el de no-palabras, sin importar si son parte de una 
lista compuesta solo por palabras o si forman parte de una lista mixta compuesta 
por palabras y no-palabras. Por otro lado, el uso estratégico explícito de 
conocimiento léxico podría verse interrumpido si se mezclaran palabras y no- 
palabras. De hecho, esto es lo que ocurre con las consonantes, que tienden a 
intercambiarse en las listas mixtas, justo como en el recuerdo de no-palabras. Sin 
embargo, sigue existiendo una ventaja de las listas mixtas sobre las listas de no- 
palabras, aunque el efecto parece estar limitado a la información sobre los ítems, 
y no a acentuar el recuerdo de la información sobre el orden (Jefferies et al., 
2006). Por tanto, parece probable que la información acerca del orden se 
almacene en un almacén fonémico y que el léxico y otro tipo de conocimiento a 
largo plazo ocurran en una etapa redintegrativa separada. Más pruebas del papel 
del conocimiento léxico en el recuerdo serial inmediato provienen de estudios de 
MCP en pacientes que sufren de demencia semántica, un estado progresivo en el 
que los pacientes pierden el acceso al significado de las palabras previamente 
familiares, en cuyo caso el rendimiento es más pobre en las secuencias que 
contienen palabras «perdidas» (Forde y Humphreys, 2002; Jefferies et al. , 
2004a). 


Este reciente desarrollo continúa encajando ampliamente dentro del modelo 
inicial del bucle fonológico, aunque, como se propuso (Baddeley, 1986), se 
enfrenta a un problema mayor, concretamente que no posee un método 


específico para el almacenamiento de la información sobre el orden. Ya ha 
quedado claro (Baddeley, 1968) que un simple proceso de encadenamiento, en el 
que cada palabra actúe como estímulo para la siguiente, no podría dar cuenta de 
los datos, y que se necesitaría algún tipo de mecanismo de orden serial más 
claramente especificado si es que se iba a desarrollar el modelo del bucle. 
Afortunadamente, este tema ha sido tratado por una serie de modeladores 
computacionales muy capaces, con los resultados que describo abajo. 


2.4. El problema del orden serial 


Mientras que el almacenamiento en orden serial es trivial y fácil para un 
ordenador tradicional basado en un procesamiento serial, este no es el caso del 
cerebro humano, que parece asemejarse más a los sistemas de procesamiento en 
paralelo. Obtener un recuerdo serial mediante un sistema paralelo está lejos de 
ser, como veremos, una tarea trivial. 


Hay dos maneras básicas de tratar el almacenamiento y la recuperación en orden 
serial, concretamente el encadenamiento y la asociación contextual; esta última 
se divide en una serie de subaproximaciones. El encadenamiento asume que cada 
ítem está ligado asociativamente con el siguiente; como consecuencia, la 
presentación de un ítem guiará al siguiente, que a su vez guiará al siguiente hasta 
el final de la secuencia. Una alternativa es la asociación de cada ítem con algún 
tipo de contexto que entonces proporciona una pista acerca del orden. La versión 
más simple de esto es el modelo de ranuras, en el que el almacenamiento de los 
ítems se basa en una serie de ranuras o localizaciones que se pueden leer al 
margen del orden de presentación (Conrad, 1965). Otros modelos contextuales 
asumen que el orden se determina asociando cada ítem con un marcador, 
usualmente el ítem inicial, y a veces el final, utilizando estas asociaciones para 
recuperar los ítems ordenadamente. Una extensa tercera categoría de modelo 
contextual asume que los ítems se asocian con un contexto en continuo cambio, 
análogo a una pista temporal, y que esto se puede usar para seguirles la pista a 
los ítems relevantes. 


2.5. Modelos de cadena 


El supuesto de que los ítems se almacenan y se recuperan a través de una cadena 
de asociaciones se remonta a Ebbinghaus (1885) y continúa siendo un supuesto 
popular (Wickelgren, 1965; Jordan, 1986; Lewandowski y Murdock, 1989; 
Murdock, 1993; Meyer y Kieras, 1999). El modelo es simple e intuitivamente 
plausible, pues propone que una lista serial se puede considerar como una 
secuencia de pares asociados, y por tanto cuando se da pie al primer ítem, este 
automáticamente llamará al siguiente y así sucesivamente. Sin embargo, como 
apuntó Lashley (1951), esta aproximación tiene una serie de problemas. El 
primero de ellos concierne al tema de los ítems repetidos. Si cada ítem depende 
del ítem previo, entonces una secuencia como 7, 9, 6, 3, 9, 5 debería ser difícil 
de recordar correctamente, ya que el mismo ítem, 9, actúa de guía para dos pares 
diferentes, el 6 y el 5. El segundo problema tiene que ver con el efecto del error 
sobre el rendimiento. Un simple modelo de cadena debería predecir que una vez 
que el sujeto ha cometido un error, la cadena se rompe, por lo que la secuencia 
subsiguiente también debería ser errónea, ya que el error en sí mismo llevará a 
una respuesta inapropiada, produciendo una cascada de errores. De hecho, en 
listas cuya longitud está en torno a la amplitud, la forma de error más común 
incluye las transposiciones, en las que dos ítems intercambian sus posiciones, 
mientras que el resto de la secuencia permanece inalterada (e.g., 4, 5, 2, 8, 7 se 
convierte en 4, 2, 5, 8, 7). Una forma de tratar estos problemas consiste en 
postular asociaciones remotas que vayan más allá de las asociaciones por parejas 
(Ebbinghaus, 1885). En principio, estas asociaciones se pueden usar para 
recuperarse de los errores inducidos por los ítems erróneos, aunque la cuestión 
sobre si estos modelos explican toda la gran serie de errores sigue estando 
abierta (Henson, 1998). 


Un efecto que no parece solucionarse asumiendo asociaciones remotas fue 
señalado por primera vez por Baddeley (1968), y explorado posteriormente por 
Henson et al. (1996). Se descubrió fortuitamente al intentar reducir el posible 
impacto de la similitud fonológica en el recuerdo de códigos postales formados 
por consonantes; su significado teórico solo se volvió evidente con la posterior 
propuesta de Wickelgren (1965) sobre la interpretación encadenada del recuerdo 
serial inmediato. Se les presentaba a nuestros sujetos secuencias de seis letras 
bajo cuatro condiciones. La primera incluía seis letras fonológicamente similares 
(e.g ., C, b, t, g, v, p); la segunda, seis letras no similares ( k, w, y, q, X, 1); 


mientras que las condiciones tres y cuatro incluían alternativamente Ítems 
similares y no similares ( k, v, y, p, r, d y g, y, t, l, p, w). Como era de esperar, 
las listas consistentemente similares fueron más difíciles que las no similares, 
situándose entre medias las listas mixtas. Sin embargo, una cuestión crucial para 
la hipótesis del encadenamiento tiene que ver con la localización de los errores. 
Por lo que se sabe del aprendizaje de pares asociados (Osgood, 1949), los errores 
surgen por la similitud entre estímulos, por tanto, los errores deberían ocurrir 
siguiendo a las letras similares más que en las letras similares. Se observó 
exactamente lo contrario. Los errores ocurrieron con mucha más probabilidad en 
los propios ítems similares que en los ítems interpolados no similares. Este 
resultado fue replicado y ampliado por Henson et al. (1996), y el supuesto de que 
los modelos de cadena predecirían lo contrario ha sido posteriormente 
confirmado por una serie de simulaciones (Burgess y Hitch, 1996; Henson, 

1998; Page y Norris, 1998). Hasta lo que yo sé, este resultado supone un 
problema para todos los modelos de cadena existentes. 


2.6. Modelos contextuales 


Conrad (1965) parece ser el único teórico reciente que sugiere que la MCP 
humana se asemeja a la de un ordenador de procesamiento serial estándar con un 
número limitado de puntos de almacenamiento colocados en orden. Sin 
embargo, él no elaboró el modelo, y dejó el número de emplazamientos sin 
especificar. Tampoco especificó la naturaleza de los ítems; el hecho de que la 
amplitud entre palabras desconectadas y frases difiera ampliamente sugiere que 
lo que se almacena no son palabras individuales, sino más bien segmentos de 
algún tipo. Por tanto, el modelo de ranuras simplemente no ha sido especificado 
o desarrollado con suficiente claridad como para constituirse como un fuerte 
contendiente de la teoría del orden serial, aunque, como veremos más adelante, 
el mecanismo de ranuras juega un importante papel en el modelo propuesto por 
Hartley y Houghton (1996). 


Se han propuesto una serie de modelos que determinan el orden serial usando 
como referencia marcadores concretos, principalmente el ítem inicial o final. 
Shiffrin y Cook (1978) propusieron un modelo en el que los ítems se 

almacenaban en términos de asociaciones entre nódulos que representaban el 


principio y el final de la secuencia, y en el que la fuerza relativa de las dos 
asociaciones proporcionaba un indicio sobre el lugar de la secuencia en el que 
había aparecido un ítem dado. Lee y Estes (1981) propusieron un modelo en el 
que la información sobre la posición quedaba especificada en una serie de 
niveles diferentes, que oscilaban desde la posición del ítem dentro de un 
segmento en un único ensayo hasta la posición que ocupa el segmento dentro del 
ensayo, que está a su vez dentro de una secuencia general de ensayos. Sin 
embargo, el modelo se desarrolló y se probó con listas de doce ítems, y la 
contribución del bucle fonológico a listas de esta longitud tiende a ser mínima 
(Baddeley, 1966b; Salame y Baddeley, 1986). 


2.6.1. El modelo de primacía 


En un modelo más reciente, Page y Norris (1998) proponen un mecanismo 
inscrito dentro del marco del bucle fonológico, que se basa en el supuesto de que 
el orden se genera asociando cada ítem sucesivo con el primer ítem presentado, 
de ahí su nombre, el modelo de primacía. En el corazón del modelo está el 
mecanismo conocido como los indicios en competición propuesto por primera 
vez por Grossberg (1978; 1987) y desarrollado posteriormente por Houghton 
(1990). En el modelo de primacía, el indicio contextual proporciona una serie de 
asociaciones con el primer ítem de la secuencia, de ahí su nombre. Cada ítem es 
representado en el modelo por un nódulo. A medida que se presenta cada ítem, 
se supone que su nódulo se asocia con el del primer ítem, pero la fuerza va 
disminuyendo. Al igual que en la hipótesis inicial del bucle fonológico, se 
supone que la fuerza decae a lo largo del tiempo, pero se reactiva potencialmente 
mediante el repaso acumulativo. En el recuerdo, el orden serial de los ítems 
constituidos se determina reinstaurando el nódulo inicial, y este activará 
entonces, en mayor o menor medida, todos los ítems presentados en la lista. Los 
primeros nódulos con una unión más fuerte con el primer ítem recibirán una 
activación mayor que los posteriores. Un filtro competitivo selecciona después el 
nódulo más activo (el primero en la cola), que será el más cercano al punto de 
partida, y alimenta una segunda etapa, antes de suprimir ese nódulo. Esta 
segunda etapa efectúa una decisión de salida: solo se emite una respuesta si el 
nivel de activación excede algún criterio. Mientras tanto, con el nódulo 
representando al segundo ítem en la secuencia suprimida, se seleccionará el 


siguiente nódulo más fuertemente asociado, y así sucesivamente. 


Los errores se pueden deber al ruido en la primera etapa, responsable de la 
información acerca del orden, o bien en la segunda etapa en la que se eligen los 
ítems. Los errores pueden ocurrir en la primera etapa como resultado del «ruido» 
dentro del sistema, y es probable que conduzcan al siguiente nódulo más 
fuertemente asociado. Por ejemplo, el ruido en la conexión entre el indicio 
inicial y el ítem tres llevaría a seleccionar el siguiente ítem más fuerte, el ítem 
cuatro, probablemente seguido del ítem tres un tanto atenuado, dando como 
resultado un error de transposición en el que el orden 1234 se convierte 1243. De 
hecho estos errores son los más comunes cuando los sujetos operan con listas 
que se aproximan a su amplitud de dígitos. Debido al decaimiento de la huella, la 
probabilidad de cometer un error se incrementará con la longitud de la 
secuencia, y tenderá a ser mayor durante la última parte de la lista, dando lugar 
al efecto de primacía estándar que caracteriza al recuerdo de dígitos visualmente 
presentados. 


El modelo de primacía se ve respaldado por un detallado examen del patrón de 
errores observado. Para cada ítem en una secuencia, la respuesta más probable es 
ese mismo ítem, seguido de los ítems adyacentes, con una tendencia muy clara y 
marcada de los ítems más cercanos a convertirse con mayor probabilidad en 
intrusiones. Esto no es cierto para todos los modelos de MCP. Tal como señala 
Nairne (1990), por ejemplo, esto supone un problema para la actual versión de 
su modelo del rasgo. 


El ruido en la fase de selección de la respuesta da lugar a errores en los ítems, y 
es en esta etapa en la que se supone que la similitud acústica influye en el 
rendimiento. Dentro del modelo del bucle, esta fase depende de la codificación 
fonológica, en la que los ítems fonológicamente similares poseen menos 
características que diferencien a los ítems relevantes, haciendo que sean más 
vulnerables al decaimiento de la huella. Dado que el efecto de similitud acústica 
influye en esta última etapa, el modelo de primacía escapa al problema de tener 
que predecir que los errores deberían seguir a ítems similares, y el modelo es 
muy exitoso generando la dentada curva producida por Baddeley (1968) y 
Henson et al. (1996). Page y Norris (1998) relacionan este último mecanismo de 
selección de la respuesta con los datos procedentes de la producción del habla, 
sugiriendo que los errores del habla probablemente reflejan el funcionamiento de 
esta etapa. Ellis (1980) había notado previamente la similitud entre los errores en 
el recuerdo verbal inmediato y los errores del habla. 


Sin embargo, es posible que la memoria y los errores del habla reflejen procesos 
de recuperación similares que operan en niveles distintos del sistema. Saito y 
Baddeley (2004) investigaron un método para inducir errores del habla basado 
en el tradicional juego de palabras japonés. A un individuo se le pide que 
pronuncie repetidamente una palabra compleja, mientras que el examinador 
pronuncia una segunda palabra. Esto provocará un error del habla, pero solo si es 
fonológicamente similar a la palabra que se repite. "Tal como Saito y Baddeley 
apuntan, este efecto se diferencia del efecto estándar del habla no atendida sobre 
el recuerdo serial en dos aspectos. Primero, a diferencia del efecto de memoria 
(Jones y Macken, 1995), este efecto depende de la similitud entre el ítem 
pronunciado y el escuchado, y segundo, en este efecto la coordinación es crucial, 
mientras que el habla no atendida interrumpe el recuerdo incluso cuando se 
presenta algunos segundos después (Norris et al. , 2004). Saito y Baddeley 
interpretan sus resultados en términos del búfer de salida del habla, que puede 
que utilice procesos de recuperación similares al almacén fonológico basado en 
la entrada. 


No hay duda de que el modelo de primacía proporciona un relato muy simple y 
altamente ingenioso de un amplio rango de datos asociados al bucle fonológico. 
Se le puede criticar por no ser más específico respecto a cómo se da pie al ítem 
inicial, lo cual es un problema para la mayoría de las teorías en esta área. 
También hay algunos tipos de errores de intrusión que no se ajustan a este 
patrón, pero que se pueden explicar con un modelo algo más complejo como el 
Modelo de Principio Final (SEM)* de Henson, que propone indicios tanto de 
primacía como de recencia: Page y Norris sugieren que esos errores son 
atribuibles a factores externos al rango de su modelo. 


2.6.2. El modelo de Principio-Final 


Como vimos, un análisis detallado del patrón de los errores puede ser 
extremadamente informativo. El modelo que probablemente más se beneficie de 
esto es el modelo SEM de Henson basado en el bucle fonológico, que asume un 
gradiente de primacía similar al de Page y Norris y también un gradiente de 
recencia. Estos dos indicios le permiten explicar tipos de errores que no se 
ajustan fácilmente al modelo de primacía. Se sabe desde hace muchos años, que 


agrupar los dígitos en tríos facilita el recuerdo, tanto si se hace insertando 
pequeñas pausas (Ryan, 1969), como si se hace con instrucciones (Wickelgren, 
1964), o espontáneamente. El patrón de recuerdo bajo estas circunstancias tiende 
a reflejar mini curvas de posición serial de tres ítems, en las que en cada trío, el 
ítem del medio muestra más errores que los ítems primero y último. Bajo estas 
circunstancias, los errores reflejan a menudo un intercambio de aquellos ítems 
con una posición serial similar dentro de cada trío (e.g., 123-456-789 se 
convierte en 123-756-489). Un segundo error característico incluye lo que 
Henson denomina «protrusiones», en las que una intrusión representa al ítem que 
estaba en esa misma posición en la lista previa. Este efecto de protrusión se ve 
debilitado por largos intervalos entre ensayos (Conrad, 1960; 1967), y solo 
ocurre cuando se pide recuerdo y el ítem apropiado se recupera exitosamente 
(Henson, 1998). No hay duda de que el modelo SEM da buena cuenta de un 
amplio rango de datos, pero lo hace a expensas de una gran complejidad. Sería 
interesante ver si su desarrollo subsiguiente justifica los supuestos adicionales. 
No hay duda de que los sujetos pueden usar la recencia al igual que la primacía, 
pero aún está por ver si funcionan dentro del mismo mecanismo o si representan 
un factor estratégico adicional. 


2.6.3. Modelos de contexto temporal 


El mecanismo de indicios en competición de Houghton ha estimulado a una serie 
de modelos que intentan instanciar el componente contextual en términos de 
algún tipo de mecanismo de sincronización. Uno de los primeros y de los más 
desarrollados es el propuesto por Burgess y Hitch (1992), modificado 
posteriormente (Burgess y Hitch, 1999). Ambas versiones del modelo asumen 
una serie de indicios temporales superpuestos basados en mecanismos de 
sincronización que operan en paralelo. A medida que se va presentando cada 
ítem, se va asociando con el patrón temporal operativo en ese momento. En el 
modelo inicial, Burgess y Hitch (1992) asumían la activación paralela de dos 
conjuntos de nódulos, uno que representaba fonemas, y otro conjunto distinto 
que representaba palabras. Supuestamente los nódulos de palabras estaban 
unidos a la señal contextual relevante, y en el modelo inicial también se suponía 
una interasociación entre nódulos a través de un proceso encadenado. Sin 
embargo, como se ha descrito anteriormente, los modelos de cadena tienen 


dificultades para dar cuenta del patrón de errores con forma aserrada hallado 
cuando se intercalan ítems similares y no similares. El modelo inicial de Burgess 
y Hitch también tenía dificultades para dar cuenta de la interacción entre los 
componentes a largo y corto plazo de la tarea, y de los efectos de la frecuencia 
de las palabras en el rendimiento. 


Para combatir estos problemas se propuso una segunda versión (Burgess y Hitch, 
1999). La nueva versión anuló el supuesto del encadenamiento y combinó las 
etapas de entrada y salida en una única capa. Una modificación más importante 
fue el supuesto de que la asociación entre el contexto y los nódulos operaba en 
dos niveles, concretamente los pesos a corto plazo más rápidos que se 
desvanecen rápidamente y los pesos a largo plazo que son más duraderos, un 
mecanismo previamente introducido por Hinton y Plaut (1987). Los pesos lentos 
proporcionan un mecanismo para el aprendizaje a largo plazo, mientras que los 
pesos rápidos permiten registrar rápidamente nuevas secuencias. Se supone que 
el proceso de inhibición de respuestas que ha sido emitido se desvanece, 
produciéndose un patrón de errores de intrusión más realista, mientras que 
supuestamente el ruido en el sistema de activación solo se da en la salida. 


El nuevo modelo es capaz de tratar el fenómeno explicado por la primera 
versión, incluyendo los efectos de longitud de la secuencia, longitud de palabras, 
similitud fonética y la presencia de frecuentes errores en el orden, y además, 
genera la curva aserrada apropiada. Otro aspecto también muy importante es que 
proporciona un mecanismo que une el bucle fonológico con la MLP, lo que 
permite la mejora del recuerdo gracias al conocimiento previo, así como la 
adquisición gradual de vocabulario nuevo como resultado del aprendizaje. Al 
igual que la mayoría de los modelos, todavía no explica con suficiente claridad 
cómo se selecciona el indicio inicial de forma que se reactive el sistema, y en la 
versión de Burgess y Hitch (1999), al igual que en el modelo de primacía y en el 
SEM, no da explicaciones de la memoria para las no palabras ni de los efectos de 
la modalidad. También depende de manera crucial de la plausibilidad del 
mecanismo de indicios de contexto temporal, un punto que retomaremos más 
adelante. Sin embargo, no hay duda de que el modelo ha sido muy influyente 
porque en su versión original fue el primero en intentar modelizar explícitamente 
al bucle fonológico, así como por su éxito al responder a los problemas de la 
versión inicial. Los desarrollos actuales se están centrando en la interfaz con la 
MLP usando el efecto Hebb, en el cual se emplea una secuencia repetida dentro 
del paradigma de la MCP serial para hacer un seguimiento de la construcción 
gradual de la MLP serial (Hebb, 1961). 


Sin embargo, mientras que el modelo revisado de Burgess y Hitch realiza un 
trabajo razonablemente bueno en el tratamiento de la memoria inmediata para 
dígitos o palabras, donde se pide al sujeto que recuerde unidades léxicas 
familiares, en la actualidad, no puede manejar secuencias de fonemas no 
familiares como ocurre con la repetición de no-palabras. Aunque el modelo sí 
tiene un nivel fonético, este componente del sistema no almacena en orden 
serial, y por tanto no podría distinguir entre pat, tap y apt. 


Si, como nosotros proponemos, la principal función del bucle fonológico es 
asistir en el almacenamiento y aprendizaje de nuevas formas fonológicas que 
eventualmente forman las palabras en el vocabulario del niño, esta es una 
limitación importante. Al menos ha habido dos intentos de paliar este problema, 
uno el de Glasspool (1995) y otro el de Hartley y Houghton (1996). 


2.6.4. Modelos de retención de no-palabras 


Hartley y Houghton (1996) propusieron mecanismos separados para el recuerdo 
de secuencias al nivel de las palabras y las subpalabras. El nivel de las palabras 
implica un modelo de indicios en competición, algo parecido al de Burgess y 
Hitch, mientras que las secuencias de no-palabras se supone que dependen de 
una plantilla o de un modelo de ranuras, en el que la secuenciación es sensible a 
la estructura fonológica del lenguaje. 


Glasspool (1995) hace frente al problema asumiendo dos huellas de memoria a 
corto plazo separadas, una al nivel de las palabras y otra a nivel fonémico. Cada 
una funciona ampliamente de acuerdo con el modelo de Burgess y Hitch (1996), 
y Cada una tiene su propio contexto temporal representando el distinto grado de 
detalle temporal de los procesos al nivel fonémico y al nivel de las palabras. El 
contexto de las palabras avanza un paso cada vez que se identifica una nueva 
palabra, mientras que el nivel fonético se mueve con cada fonema. Ambos 
sistemas convergen para producir una única salida, en la que el nivel de las 
palabras solo contribuye si está fuertemente activado. El modelo predice 
correctamente que la amplitud para las palabras será mayor que para las no- 
palabras por la contribución a largo plazo de la estructura temporal existente 
dentro de la palabra, y que los errores que representan la reordenación de los 


fonemas ocurren más frecuentemente en la memoria para las no-palabras que en 
la memoria de las palabras (Aaronson, 1968). 


El modelo de Glasspool podría criticarse por ser poco parsimonioso al incluir 
dos sistemas en vez de uno, aunque la cuestión de la parsimonia es siempre 
difícil de juzgar. Por ejemplo, alguien podría argumentar que el uso de los 
mismos principios a lo largo de los distintos niveles es en principio una 
estrategia parsimoniosa. Se suscita la interesante cuestión de que a lo mejor se 
podría postular un nivel por encima del de las palabras, con sistemas similares 
para la sintaxis, la semántica a nivel de las palabras y el alto conocimiento del 
mundo. Este sistema se podría considerar como una variante del modelo de 
«pandemonium» propuesto por Selfridge ya en 1955, como una manera de 
conceptualizar el procesamiento de abajo a arriba de la información compleja, y 
podría ofrecer una posible solución al problema de cómo la memoria inmediata 
utiliza la codificación en tantos niveles diferentes. Esta solución coincide 
también con el espíritu de la propuesta de Grossberg (1987), según la cual un 
limitado número de mecanismos, como el de los indicios en competición, son 
utilizados en muchos papeles biológicos diferentes. Sin embargo, podrían surgir 
importantes problemas al intentar implementar un modelo computacional de 
múltiples niveles coordinados como este. 


Los modelos descritos solo representan a un subconjunto dentro del gran número 
de intentos de producir modelos computacionales o matemáticos de recuerdo 
serial. Se han seleccionado porque intentan explicar de manera específica datos 
relevantes para el bucle fonológico, como componente de la memoria de trabajo, 
y se presentan de manera inteligible para un experimentador matemáticamente 
limitado como yo. Es importante tener en cuenta, sin embargo, que se han 
desarrollado modelos de orden serial alternativos, los que rechazan 
explícitamente la hipótesis del bucle fonológico. Algunos, aunque no todos, se 
discuten en el próximo capítulo. 


Notas al pie 


* Siglas en ingles de « No words repetition». N. de la T. 
* Del inglés Start End Model. N, de la T. 


CAPÍTULO 3 


El bucle fonológico 


Retos y puntos de interés 


Aunque el bucle fonológico solo constituye una parte relativamente pequeña de 
la memoria de trabajo, es probablemente el aspecto más distintivo del modelo 
multicomponente de Baddeley y Hitch (1974), y el que ha sido investigado con 
más detalle. Después de más de 30 años continúa generando controversias, y lo 
que es más importante, nuevos e interesantes datos. Los desafíos se presentan en 
dos niveles principales. La primera línea de ataque, y la más general, representa 
la clásica objeción planteada originariamente contra el concepto de memoria a 
corto plazo, a saber, que la memoria de trabajo es un concepto innecesario 
puesto que el fenómeno que explica simplemente refleja aspectos de la memoria 
a largo plazo. La segunda fuente de críticas proviene de los defensores de 
modelos de memoria a corto plazo alternativos, que ofrecen una versión 
diferente de varios de los fenómenos atribuidos al bucle fonológico. 


Estos desafíos serán discutidos por orden, comenzando con el ataque 
relativamente reciente de lo que se denomina «el modelo estándar», que 
demuestra ser una versión simplificada del bucle fonológico. 


3.1. La crítica de Nairne 


Aunque he tratado la memoria de trabajo como si fuera un concepto 
generalmente aceptado, sigue existiendo dentro de la tradición del aprendizaje 
verbal y la memorística, un continuo compromiso con un punto de vista unitario 
acerca de la memoria. Esto se ha expresado más fuertemente en una crítica 
relativamente reciente al concepto de memoria de trabajo presentada por James 


Nairne (2002), un distinguido investigador sobre memoria. Se publicó en agosto 
en la citada revista, Annual Review of Psychology, con el título «Remembering 
over the short-term: The case against the standard model». Comencé a leerlo con 
algo de aprensión, pero lo terminé con cierta confusión. Ciertamente discrepaba 
a tenor de la conclusión general de que, «cada vez más, los investigadores están 
reconociendo que la retención a corto plazo se conduce a través de los indicios, 
de manera similar a la memoria a largo plazo, y que es probable que ni el repaso 
ni el desvanecimiento expliquen las particularidades del olvido a corto plazo» 
(Nairne, 2002, p. 53). Pero después, cuando lo fui revisando punto por punto, 
descubrí que estoy de acuerdo con la mayoría de ellos. ¿Cómo puede ser esto? 


Creo que la respuesta está en el título, «Recordando a corto plazo». De hecho, 
recuerdo haber escuchado cómo Jim Nairne, presente como invitado en una 
conferencia centrada en el tema de que la memoria a corto plazo no existe, 
describía su propósito de explicar los procesos de memoria que operan a lo largo 
de los 30 segundos después de que se haya presentado una porción de 
información. El recuerdo durante los primeros 30 segundos probablemente 
refleje una amalgama de comportamientos basados en diversos sistemas 
subyacentes, incluyendo tanto la memoria de trabajo como una contribución 
sustancial y más estable de la MLP. Por ejemplo, el paradigma de olvido a corto 
plazo de Peterson y Peterson (1959) refleja un pequeño componente de la MCP, 
junto con la contribución sustancial de la MLP (ver Baddeley 1998, pp. 31-37 
para una discusión). Nairne y yo estamos de acuerdo con la posible 
interpretación del olvido en la tarea de Peterson, en términos de una 
discriminación de los indicios temporales (Baddeley, 1976, pp. 126-131), y los 
dos proponemos que también puede aplicarse un mecanismo similar al efecto de 
recencia en tareas de memoria tanto a corto plazo como a largo plazo (Baddeley 
y Hitch, 1977; 1993). 


Nairne sigue planteando una serie de problemas relacionados con el concepto de 
repaso subvocal, el cual considera central en lo que él denomina «modelo 
estándar». Entre ellos se incluyen: 


1. Implementar un modelo concreto de repaso es probablemente difícil. Estoy de 
acuerdo: al menos, dentro del bucle fonológico, el repaso es una actividad 
encubierta bajo control estratégico. Más aún, incluye una forma de habla 
subvocal y, por tanto, una teoría adecuada tendrá que relacionarse con una teoría 


de producción del lenguaje —algo que no es sencillo—. Esto es, diría yo, una tarea 
tanto necesaria como valiosa. 


2. Las diferencias individuales en la amplitud aparecen cuando se eliminan las 
diferencias en la tasa de ensayos. Este es ciertamente el caso. Sin embargo, yo 
esperaría que la capacidad y/o la duración del almacén fonológico varíe de unos 
individuos y otros, y que estos fueran vulnerables a los daños neurológicos, 
como en el caso de PV (Vallar y Baddeley, 1984a). 


3. Cuando se controlan los ensayos, un material diferente da lugar a un 
rendimiento de memoria diferente. Por ejemplo, las palabras similares son más 
difíciles que las no similares, y las palabras son más fáciles que las no palabras. 
Estoy completamente de acuerdo en que es probable que ninguno de estos 
efectos dependa del proceso articulatorio, y que se necesita un modelo más 
completo, como el que proporciona la hipótesis del bucle fonológico. 


4. Los efectos de la longitud de palabra son atribuibles al retraso en la entrada, y 
podrían ocurrir cuando la presentación es demasiado rápida para permitir el 
repaso. Sugiero que tanto el repaso encubierto durante la presentación como el 
repaso en voz alta durante el recuerdo son efectos basados temporalmente, y 
ambos se ajustan a la hipótesis del bucle fonológico. 


5. Los pacientes que han perdido la capacidad de articulación pueden seguir 
manifestando un efecto de la longitud de palabra. Esto ocurre porque el repaso 
implica la ejecución de un programa de habla interna y no la articulación en voz 
alta (Baddeley y Wilson, 1985). Consistente con esta visión es la observación de 
que la dispraxia, con la que no se pueden construir estos programas, suprime el 
efecto de la longitud de palabra (Caplan y Waters, 1995). 


En resumen, los temas que aborda Nairne son problemáticos para un modelo que 
en sí mismo esté limitado por completo a un simple bucle de repaso que ni 
siquiera incluya un almacén fonológico que se pueda separar potencialmente. 
Esto no era cierto para la hipótesis del bucle fonológico, incluso en su versión 
más temprana. 


Una parte sustancial de la tesis de Nairne se basa en la tarea del olvido a corto 
plazo de Brown-Peterson, en la que una pequeña cantidad de material, como un 
trío de consonantes, se retiene durante unos segundos durante los cuales se 


impide el repaso mediante una tarea concurrente. Este paradigma no implica al 
bucle fonológico, y de hecho no se ve afectado por la supresión articulatoria 
concurrente (Baddeley et al. , 1984a). Coincido con Nairne en que está mejor 
explicado en términos de la relativa discriminación de los indicios temporales 
(Baddeley, 1976, pp. 126-131; Nairne, 2002), y que en este sentido se asemeja al 
efecto de recencia en el recuerdo libre (Baddeley y Hitch, 1977). Las dos cosas 
serán discutidas en el Capítulo 6. 


Un punto sobre el que no estamos de acuerdo tiene que ver con la importancia 
que tiene para la teoría actual la declaración cuasi-filosófica de McGeoch (1932) 
de que el tiempo per se no puede afectar a las propiedades físicas, y que esas 
propiedades solo pueden ser influidas por acciones que ocurran dentro de ese 
tiempo, alejando por tanto al decaimiento de la huella de las bases lógicas 
(McGeoch e Irion, 1952). Nairne cita esto con aprobación. Sin embargo, el 
cerebro está en constante actividad, por lo que no es probable que haya 
momentos genuinos sin rellenar (al menos antes de morir). Por tanto, una 
distinción más apropiada estaría entre el decaimiento, entendido como olvido 
debido a la actividad neural general (que ocurre durante una demora), y el olvido 
debido a la interferencia específica. Mi punto de vista es que ambos son 
posibles. 


Sugiero, por tanto, que muchas de las críticas de Nairne se basan en un «modelo 
estándar» excesivamente simplista, un modelo que no mantiene ningún teórico 
con el que yo me haya encontrado. Ciertamente no es una representación 
adecuada del actual modelo multicomponente de memoria de trabajo, ni siquiera 
de un componente más limitado como lo es el bucle fonológico. Me complació 
saber que, al parecer, ahora también estamos de acuerdo en este punto. En una 
discusión sobre sus puntos de vista más recientes, Nairne (2003) reconoce que 
los rasgos verbales/acústicos juegan un papel distintivo en las tareas de MCP, y 
que nuestros puntos de vista son mucho más comparables de lo que podrían 
parecer (Nairne, comunicación personal, 2006). 


Esto no significa que ahora haya un acuerdo general acerca de la interpretación 
del fenómeno sobre el que se basó el bucle fonológico. Como se mostrará en la 
siguiente sección, el bucle fonológico continúa generando vigorosa y, según 
creo, fructífera controversia. 


3.1.1. La hipótesis del bucle fonológico: interpretando la evidencia 


A lo largo de los últimos 30 años, la hipótesis del bucle fonológico ha 
continuado estimulando la investigación empírica. Algunas de las 
investigaciones se generan por la existencia de modelos enfrentados como los 
presentados por Nairne (2002), que acentúan las similitudes con la MLP, o como 
el de Jones (1993), que intenta explicar el fenómeno en términos perceptivos. 
Más aún, tal como indica una revisión sobre las aproximaciones teóricas a la 
memoria de trabajo de Miyake y Shah (1999a), muchos teóricos aceptan la 
necesidad de algún tipo de tránsito verbal o de memoria fonológica, pero son 
relativamente neutrales respecto a cuánto se aproximan esos procesos al bucle 
fonológico o a la agenda visoespacial. Cowan (1999; 2005), por ejemplo, 
contribuye de forma importante a la investigación empírica sobre la MCP 
fonológica, pero al crear modelos se concentra en el papel de la atención, más 
que en los detalles de la contribución fonológica. La MCP verbal juega un papel 
en el modelo de producción de sistemas desarrollado por Meyer y Keiras (1999), 
el cual ciertamente asume el decaimiento de la huella. Sin embargo, la MCP 
verbal no es esencial para el modelo, que podría acomodarse a un cambio en este 
componente sin que se viera seriamente amenazada su utilidad como 
herramienta para analizar el rendimiento en tareas cognitivas complejas, lo que 
constituye su principal objetivo. Finalmente, como se aclarará más tarde en este 
capítulo, mucha de la investigación en esta área se ha llevado a cabo por 
investigadores con el compromiso de responder a las cuestiones básicas, pero sin 
responder de manera particular a ninguna teoría en general. 


Sin embargo, todos coinciden en que decidir entre teorías en competición 
debería depender de un examen relativamente detallado de los datos. La próxima 
sección da cuenta del modelo del bucle fonológico y de las nuevas evidencias 
que el modelo ha ayudado a generar, comenzando por el tema que 
probablemente haya estimulado una investigación más extensiva y una 
controversia más vigorosa, el efecto de la longitud de la palabra. 


Sin embargo, antes de comenzar con un análisis detallado, podría ser de utilidad 
para los lectores alejados de este campo, un brevísimo recordatorio de la 
hipótesis del bucle fonológico. El material verbal se supone que se encuentra en 
un almacén fonológico de capacidad limitada en el que las huellas decaen 
relativamente rápido, pero pueden refrescarse mediante la articulación subvocal. 


La articulación subvocal puede utilizarse también para recodificar verbalmente 
material presentado visualmente, permitiendo, por tanto, que el material quede 
registrado en el almacén fonológico. 


Se supone que el bloqueo de este proceso mediante la supresión articulatoria 
previene el repaso. Esto eliminará la codificación fonológica del material 
presentado visualmente, pero no impedirá que el material auditivo tenga un 
acceso al almacén fonológico. 


3.2. El efecto de la longitud de palabra 


Uno de los fenómenos más robustos de la MCP verbal es el efecto de la longitud 
de palabra, una disminución sistemática en la amplitud de la memoria observada, 
a medida que la longitud de las palabras a recordar se incrementa (Baddeley et 
al. , 1975). El efecto se atribuía inicialmente al efecto del desvanecimiento de la 
huella durante el repaso; las palabras más largas necesitan repasarse más, lo que 
da lugar a un mayor desvanecimiento. Consistente con esta opinión era el hecho 
de que cuando se impide el repaso mediante la pronunciación de una secuencia 
de sonidos irrelevantes como la palabra «la» («the»), el rendimiento baja, y el 
efecto de la longitud de las palabras desaparece (Baddeley et al. , 1975). La 
ausencia del efecto de la longitud en pacientes con MCP fonológica deteriorada 
también apoya esta idea (Vallar y Baddeley, 1984a), al igual que el 
descubrimiento de Nicolson (1981) de que el incremento evolutivo de la 
amplitud de dígitos en niños se asociaba con el incremento paralelo de la tasa de 
articulación y, por tanto, presumiblemente con el repaso. Sin embargo, tanto la 
longitud de las palabras como la velocidad de articulación son variables 
complejas, lo que permite una variedad de interpretaciones alternativas que han 
retado y modificado las explicaciones básicas basadas en el repaso. Algunas de 
ellas se discuten más abajo. 


3.2.1. ¿Desvanecimiento de la huella o interferencia? 


La cuestión acerca de si el olvido a lo largo de pequeños intervalos representa el 
desvanecimiento de una huella de memoria temporal o una interrupción por 
interferencia ha estado presente desde el clásico trabajo de Brown (1958) y de 
Peterson y Peterson (1959). La mayoría de las teorías de MCP asumen un 
sistema de capacidad limitada. Llegado el caso, es probable que se dé un 
desplazamiento de los primeros ítems a medida que se procesan los nuevos. Sin 
embargo, aún permanece la cuestión de si en los niveles de amplitud inferior, en 
ausencia de ese desplazamiento, la huella de memoria se desvanecerá o no. En 
segundo lugar, cuando se excede la amplitud, ¿cuál es la naturaleza de este 
proceso de desplazamiento? Ambas cuestiones permanecen sin resolver. 


Nuestro modelo inicial del bucle fonológico asumía el desvanecimiento de la 
huella, porque parecía ser el supuesto más simple consistente con los datos, 
evitando la necesidad de explicar los procesos de desplazamiento o de 
interferencia. Posteriormente pareció estar apoyado por análisis detallados del 
efecto de la longitud de la palabra que mostraban que, cuando el número de 
sílabas permanecía constante, la amplitud para las palabras con largos sonidos 
vocales como « harpoon» y « Friday» era menor que para las palabras con una 
pronunciación más rápida como « bishop» y « wicket» (Baddeley et al. , 1975). 


Caplan et al. (1992) desafió este resultado proponiendo, en cambio, que la 
complejidad de las palabras daba mejor cuenta de los determinantes de la 
amplitud. Utilizando un conjunto distinto de palabras procedentes de Baddeley 
et al. (1975), no encontraron evidencia de que las palabras que se pronunciaban 
más lentamente fueran peor recordadas; de hecho, en un caso, sus palabras más 
largas fueron mejor recordadas. Baddeley y Andrade (1994) criticaron su estudio 
sobre la base de que la estimación de la longitud de las palabras estaba basada en 
el tiempo necesitado por una persona ajena para pronunciar una sola palabra 
aisladamente, y no en la tasa de producción de secuencias de palabras de los 
sujetos. También encontramos que los dos nuevos conjuntos de palabras se 
diferenciaban en el grado de similitud fonológica, siendo las palabras con mayor 
rapidez de articulación más similares unas a otras. Ambos factores estarían 
actuando en contra de los resultados encontrados por Baddeley et al. (1975). 


Caplan y Waters (1994) repitieron su estudio, esta vez pidiendo a sus sujetos que 
leyeran las palabras en orden para medir el tiempo de articulación; de nuevo, no 
encontraron apoyos para el desvanecimiento de la huella; tampoco encontraron 
diferencias en cuanto a la similitud fonológica de los dos conjuntos, cuando las 
palabras eran valoradas por sus propios sujetos. Sugirieron que la diferencia 


probablemente residía en la pronunciación diferente de las palabras entre sus 
sujetos americanos y el grupo británico examinado por Baddeley y Andrade. Un 
estudio posterior de Lovatt et al. (2000) utilizó sujetos ingleses y un tercer 
conjunto de palabras presentadas tanto visual como auditivamente. Aunque 
encontraron que uno de los conjuntos de palabras era más lento que el otro 
cuando se leían en una lista, no encontraron diferencias en el recuerdo posterior 
de los dos conjuntos de palabras, aunque sí encontraron una ventaja de las 
palabras de más larga duración en una condición, la opuesta a la predicha por el 
bucle fonológico. Sin embargo, sí se replicó el estudio de Baddeley et al. (1975) 
cuando utilizaron el conjunto de palabras original. 


Por tanto, parecía como si hubiéramos caído en un falso efecto del lenguaje, en 
el que se extraen conclusiones generales a partir de conjuntos específicos de 
palabras, que posteriormente demuestran ser atípicos (Clark, 1973). El efecto de 
duración se replicó usando nuestras propias palabras (Lovatt et al. , 2000), pero 
no pareció generalizarse a otros conjuntos. Mi propio punto de vista era que el 
grado de inconsistencia simplemente reflejaba la insensibilidad de esta 
aproximación. Existe un conjunto muy limitado de palabras que permiten una 
variación en la duración de pronunciación mientras permanece constante el 
número de sílabas, y muchas variables posiblemente confusas que pueden influir 
en el recuerdo. Es por tanto improbable que este paradigma proporcione una 
respuesta clara. 


Aparentemente, Mueller et al. (2003) también compartían mis dudas sobre si los 
métodos usados en la actualidad dentro de este campo eran suficientes para 
probar la hipótesis, pero, más que aceptarlos, empezaron a mejorarlos. 


Argumentaron que la similitud fonológica era probablemente una variable 
importante, pero estaban insatisfechos con las tasas de similitud simplemente 
subjetivas. En su lugar, cogieron el estímulo y lo dividieron en sus rasgos 
fonológicos básicos, consiguiendo un algoritmo que asignaba en cada caso una 
medida de similitud que se podía obtener completamente de manera objetiva. En 
segundo lugar, adoptaron una estrategia mucho más minuciosa para medir el 
tiempo de articulación. Para cada conjunto de palabras, presentaban 
sistemáticamente secuencias de distinta longitud, dejando a los sujetos que 
practicaran primero para asegurarse de que podían recitar la secuencia, y luego 
medían la velocidad de articulación. Curiosamente encontraron que el tiempo 
medio de articulación no solo variaba con la longitud de los ítems y con el 
número de ítems en la secuencia, sino que además aparecía una función algo 


distinta dependiendo de qué conjunto concreto de palabras se usara. En tercer 
lugar, obtuvieron medidas de complejidad verbal. Después continuaron midiendo 
el recuerdo de varios de los conjuntos de materiales utilizados en estudios 
previos, en cada caso ajustando las funciones relacionadas con el rendimiento en 
complejidad, duración del habla y similitud fonológica. No encontraron efectos 
en cuanto a la complejidad, mientras que las variables de duración del habla y 
similitud fueron claramente significativas (ver Fig. 3.1). 


Sus resultados, por tanto, parecen proporcionar un claro apoyo a la importancia 
del olvido temporal, tal como lo había propuesto Baddeley et al. (1975). Al 
hacerlo, sus resultados sugieren que, casualmente, el conjunto de palabras 
seleccionado en el primer estudio proporciona una prueba más válida para la 
hipótesis del decaimiento que la que proporcionan los conjuntos posteriores. 
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Fig. 3.1. El gráfico superior muestra las amplitudes de memoria observadas 
frente a las predichas, para seis conjuntos de palabras basadas en la regresión 
lineal múltiple, usando la duración de articulación media y disimilitud 
fonológica como variables predictoras. Los números se refieren a los diferentes 
conjuntos de palabras. El gráfico inferior muestra el efecto residual de la 
complejidad fonológica después de eliminar el efecto estimado de la duración y 
la disimilitud. Datos procedentes de Mueller et al. (2003). 


Mueller et al. concluyen acentuando la necesidad de un cuidado metodológico al 
utilizar pequeñas diferencias en la longitud de palabras habladas como base para 
conclusiones teóricas, remarcando cinco advertencias para examinar las 
hipótesis en esta área. Entre ellas se incluyen: 


1. Puede que las duraciones articulatorias estén mal medidas. Es necesario medir 
la articulación de secuencias de ítems, teniendo en cuenta que esto variará de 
acuerdo con los ítems y con la longitud de la secuencia. 


2. Las estrategias de recuerdo son opcionales y se necesita acotar la situación 
para asegurar una estrategia verbal. 


3. Incluso con el repaso, las estrategias varían: por ejemplo, dada una cadena de 
letras no relacionadas, los sujetos en lugar de repasar simplemente las letras, 
puede que utilicen las vocales para construir trozos de sílabas de muchas letras. 


4. Incluso pequeñas diferencias en la similitud acústica pueden tener grandes 
efectos. 


5. Estos efectos pueden interaccionar con la longitud de la secuencia y la 
estrategia. 


Parece poco probable que hayamos visto el final de esta particular controversia, 
aunque el supuesto rigor del estudio de Mueller et al. puede desanimar a todo 


investigador, incluso al más decidido. Esto podría favorecer que nos 
concentráramos en otros métodos de diversa complejidad y tiempo, como los 
llevados a cabo por Cowan y colegas. 


En un estudio, Cowan et al. (1992) pusieron a prueba la hipótesis del 
desvanecimiento presentando una mezcla de palabras largas y cortas, variando el 
punto de la secuencia en el que aparecían las palabras largas. En una condición, 
las palabras largas estaban cerca del principio de la secuencia, y en la otra hacia 
el final. Ellos argumentaban que si se colocaban las palabras largas al principio, 
esto provocaría que durante el proceso de recuerdo, decir o escribir las palabras 
largas del principio retrasaría el recuerdo de las últimas palabras cortas. Sin 
embargo, si las palabras largas estuvieran hacia el final de la prueba, las palabras 
cortas se pronunciarían al principio, dando lugar a una demora en promedio más 
corta. Tal como se había predicho, la última condición dio lugar a un mejor 
recuerdo. 


Otro método de manipulación de la demora fue utilizado por Baddeley y Hull 
(1979): los sujetos escuchaban una cadena de dígitos, descritos como un número 
de teléfono. La secuencia era precedida o seguida por el nombre de un pueblo 
(esto ocurría en la época en la que se le decía al operador telefónico el nombre 
del pueblo y el número). Se usaron dos pueblos de Gales, uno corto, Rhyl 
(pronunciado ril), mientras que el otro era largo, Abergavenny. El nombre corto 
daba lugar a un recuerdo de los dígitos consistentemente mejor que el nombre 
largo, independientemente de que fuera el experimentador quien dijera el 
nombre interpolado como un sufijo, o que lo dijera el sujeto como un prefijo 
para recordar los dígitos. 


Sin embargo, ni este estudio ni el de Cowan et al. (1992) se propusieron 
distinguir entre un efecto temporal y un efecto del número de sílabas 
interpoladas. Por ello, Cowan (1992) desarrolló otra técnica en la que los ítems 
permanecían constantes en longitud, pero se pedía a los sujetos que los 
recordaran bien rápidamente o bien lentamente. Observó que la articulación 
rápida daba lugar a un mejor recuerdo, un hallazgo que ha sido desafiado por 
Service (2000), con la posterior réplica de Cowan et al. (2000). Este asunto 
permanece sin resolver, al igual que toda la cuestión acerca de si el 
desvanecimiento de la huella resultará ser finalmente una explicación 
satisfactoria del olvido dentro del bucle fonológico o si es necesaria una 
interpretación más compleja. Desgraciadamente, esta cuestión aparentemente 
sencilla ha demostrado ser, a lo largo de 40 años, muy difícil de contestar. 


3.2.2. ¿La longitud de las palabras funciona a través del repaso o del recuerdo 
demorado? 


En su estudio original, Baddeley et al. (1975) intentaron eliminar las diferencias 
en el olvido durante el proceso de recuerdo, pidiendo a los sujetos que 
respondieran escribiendo solo las tres primeras letras de cada ítem recordado, 
intentando así equiparar el tiempo de escritura de las palabras cortas y las largas. 
Sin embargo, como Longoni et al. (1993) apuntan, es enteramente posible que 
los sujetos estuvieran pronunciando las palabras en voz baja antes de escribirlas, 
dejando abierta la posibilidad de que gran parte del efecto observado pudiera 
seguir debiéndose a la demora en la salida más que a un repaso lento. Este efecto 
de demora en la salida fue demostrado por Cowan et al. (1992). Más apoyo a 
esta idea provino de un estudio de Henry (1991), que usó una técnica de sondeo 
en la que se presentaba una secuencia de ítems, después se les proporcionaba un 
ítem de la secuencia y luego se les pedía el siguiente. Bajo estas circunstancias 
que minimizan el efecto del retraso en la salida, aparece un efecto de longitud de 
palabra mucho más reducido. Este hallazgo fue replicado y ampliado por Avons 
et al. (1994). Más apoyo a la importancia del retraso en la salida provino de un 
estudio de Coltheart y Langdon (1998), en el que emplearon una presentación 
muy rápida para minimizar así la posibilidad de que se usara el repaso durante la 
entrada. Se encontraron claros efectos tanto de la longitud de palabra como de la 
similitud fonológica. 


Sin embargo, mientras que todos estos investigadores argumentaban acerca de la 
importancia del olvido en la salida, no rechazaban la posibilidad de que el repaso 
también contribuyera al efecto de longitud de palabra. Dosher y Ma (1998), sin 
embargo, sugirieron que el efecto de longitud de palabra podría depender 
completamente del olvido durante el recuerdo. Emplearon una aproximación 
correlacional en la que se medían y usaban diversas variables para predecir el 
rendimiento posterior en memoria. La mejor de sus variables predictoras 
demostró ser el tiempo de articulación durante la salida, un proceso de recuerdo 
que empleaba un tiempo considerablemente mayor que el que necesitaban sus 
sujetos para repasar los ítems, que típicamente era un tiempo medio de cuatro a 
cinco segundos. Puesto que añadiendo otras medidas como la tasa de repaso no 
se conseguía un mejor ajuste a sus datos, sugirieron que no había necesidad de 


asumir otra variable más que la del retraso en la salida. 


De hecho, los resultados de Dosher y Ma fueron consistentes con la propuesta de 
que una producción más lenta causaba un peor recuerdo, pero también eran 
consistentes con la hipótesis contraria. Por tanto, se podría argumentar 
razonablemente que si las huellas de memoria fueran débiles, se necesitaría más 
tiempo para recuperarlas. Esta confusión supone inevitablemente un problema 
cuando, como es habitual en los estudios en esta área, la medida de la velocidad 
de articulación se basa en la velocidad del recuerdo: cualquier variable que dé 
lugar a un peor recuerdo conllevará una recuperación más lenta, dando lugar a 
una correlación positiva. Uno podría esperar, por ejemplo, que las secuencias 
con una mayor proporción de consonantes fonológicamente similares se 
recordaran peor y más lentamente. Sin embargo, esto no justificaría la 
conclusión de que el efecto de similitud se deba a la demora en la salida. 


Baddeley et al. (2002a) intentaron evitar esta confusión controlando el tiempo de 
producción mediante un procedimiento de reconocimiento. Los sujetos 
escuchaban o veían una secuencia de palabras largas o cortas, seguida de una 
segunda secuencia idéntica, o con dos ítems cambiados. Los sujetos tenían que 
decidir si la secuencia era igual o diferente. Por ello se controló el tiempo entre 
la presentación y el test, y se mantuvo constante para las palabras largas y cortas. 
Si, a pesar de esto, se observaba un efecto de longitud de palabra, esto sugeriría 
que el efecto estaba actuando sobre el repaso. Este test de reconocimiento se 
comparó con el procedimiento de recuerdo estándar, en el que se asumía que el 
efecto de longitud de palabra implicaba tanto al repaso como al retraso en la 
salida. 


Se encontraron claros efectos de la longitud de palabra tanto en el recuerdo 
como en el reconocimiento, lo que indicaba un efecto mediado tanto por el 
repaso como por el retraso en la salida. Esta conclusión se reforzó gracias a un 
segundo experimento en el que se empleó la supresión articulatoria durante la 
etapa de reconocimiento, para eliminar la posibilidad de que los sujetos pudieran 
repasar en voz baja a su propio ritmo mientras procesaban visualmente el 
conjunto de reconocimiento. De nuevo, hubo claras evidencias a favor del papel 
de la longitud de palabra durante la entrada, reflejando presumiblemente el 
repaso subvocal. En todos nuestros estudios, sin embargo, se observó un efecto 
de longitud de palabra mucho mayor con los procedimientos de recuerdo 
estándar, en los cuales hubiéramos esperado que se incluyeran efectos tanto de 
repaso como de retraso en la salida. 


En resumen, yo esperaría que durante la presentación se diera el repaso 
subvocal, y durante el recuerdo, la pronunciación en voz alta o baja, ya que 
esencialmente están implicados los mismos procesos, concretamente, la 
recuperación serial y la articulación de los ítems recordados. Cuando estos 
procesos se ralentizan, mediante el uso de palabras más largas, se dará un olvido 
mayor. 


3.2.3. Tasa de articulación y amplitud de memoria 


Si el efecto de longitud de palabra influye, a través de su impacto, en la 
velocidad de repaso y en el recuerdo, entonces cabría esperar que los sujetos que 
articularan rápidamente tendieran a recordar más que los sujetos con una 
velocidad de articulación baja, ya que al repasar rápidamente hay menos tiempo 
para que se desvanezca la huella. Baddeley et al. (1975) confirmaron que este 
era el caso. Un estudio evolutivo posterior de Nicolson (1981) demostró que el 
incremento sistemático en la amplitud de dígitos a medida que crecen los niños 
era paralelo al incremento en su tasa de articulación, un resultado que se ha 
replicado a menudo (Hitch et al. , 1989; Hulme et al. , 1984). Estos robustos 
resultados parecían proporcionar un refuerzo mayor a la hipótesis del 
desvanecimiento. 


Sin embargo, el tema parece ser más complejo de lo que parecía en un principio. 
En una serie de estudios más detallados, Cowan y sus colegas trataron este tema 
analizando con detalle el tiempo de articulación de sus sujetos, dividiéndolo en 
dos componentes: el tiempo requerido para pronunciar cada ítem y el lapso de 
tiempo entre la pronunciación de un ítem y el sucesivo. Encontraron que la 
duración de ese espacio de tiempo estaba más asociado con las diferencias 
individuales en amplitud que con el tiempo usado para la pronunciación (Cowan 
et al. , 1994). Ellos sugieren que esta pausa inter-ítem refleja el tiempo 
necesitado para acceder a la huella de memoria, lo que sugiere, en línea con el 
anterior trabajo de Sternberg (1966), que podría representar la velocidad a la que 
un individuo dado puede escanear los ítems que han sido almacenados. Por 
tanto, los sujetos que son rápidos escaneando tienen mayores amplitudes. A 
medida que crecen los niños, su nivel de escaneo memorístico aumenta, y ellos 
sugieren que, más que la tasa de articulación, es esto lo que predice la amplitud 


de memoria. 


Sin embargo, a pesar de lo ingeniosa, la hipótesis del escaneo serial de Sternberg 
sigue siendo controvertida, existiendo cantidad de hipótesis alternativas que 
explican mejor los datos (ver Baddeley, 1990, pp. 199-202, para una revisión). 
Sin embargo, no es necesario aceptar el mecanismo de escaneo serial para 
apreciar que la sugerencia de Cowan es plausible. Es posible que el hueco entre 
palabras refleje el tiempo requerido para recuperar un ítem, al margen del 
mecanismo de recuperación, y que, entonces, las diferencias en la velocidad de 
recuperación influyan en la eficacia del proceso de memoria. Sin embargo, 
Cowan et al. basaron sus mediciones en la velocidad de articulación durante la 
secuencia de recuerdo, la cual, como vimos en la discusión de Dosher y Ma 
(1998), podría ser resultado de una huella de memoria débil, más que el reflejo 
de una causa subyacente como pudiera ser una lenta tasa de escaneo 
memorístico. 


Este tema fue tratado por Jarrold et al. , que midieron la tasa de articulación 
independientemente del rendimiento en recuerdo, usando secuencias ajustadas a 
la amplitud para estudiar el proceso de articulación. Al igual que Cowan et al., 
nosotros encontramos dos componentes independientes, uno relativo a los 
espacios entre palabras y el otro relativo a la duración de pronunciación de los 
ítems. Ambos contribuyeron de manera independiente a explicar las diferencias 
en amplitud de memoria. Jarrold et al. encontraron que el incremento en la 
amplitud de memoria de los niños a medida que crecen está mejor explicado por 
las pausas entre ítems, las cuales probablemente reflejan, coincidiendo con 
Cowan, una recuperación progresivamente más eficaz a medida que crecen los 
niños. Sin embargo, las diferencias entre palabras cortas y largas cuando se 
mantiene constante la edad se explicaban mejor por la duración de 
pronunciación que por el espacio de tiempo entre palabra y palabra. Esto apoya 
la idea de que el efecto de longitud de palabra en adultos refleja diferencias entre 
palabras largas y cortas en cuanto a su impacto en el olvido, más que en la 
velocidad de recuperación. Este enfoque apoya y extiende el de Cowan et al. 
(1994), y es consistente con una versión elaborada de la hipótesis del bucle 
fonológico. 


3.2.4. ¿Son más frágiles las palabras largas? Una interpretación localizada 


A pesar de que la hipótesis del desvanecimiento temporal parece ajustarse muy 
bien a los datos, se han propuesto otros enfoques, concretamente el de Brown y 
Hulme (1995) y el de Neath y Nairne (1995). Brown y Hulme sugieren que las 
palabras largas dan lugar a un peor recuerdo no porque se tarde más en 
pronunciarlas, sino porque son más complejas al tener más segmentos que las 
cortas. Esto hace que haya más probabilidades de que al menos un segmento se 
pierda, dando lugar a un error o a una omisión. De hecho describen un modelo 
en el que este parece ser el caso. Por supuesto, una palabra de cinco sílabas no es 
cinco veces más probable de olvidar que una palabra de una sola sílaba. Esto lo 
atribuyen a un proceso de redintegración, en el que se usa el conocimiento 
lingúístico para corregir errores en las palabras. Este proceso también 
proporciona una interpretación plausible sobre por qué las palabras son más 
fáciles de recordar que las no-palabras. Como apuntan Brown y Hulme, en la 
actualidad no se encuentra especificada la naturaleza del proceso de 
redintegración. Su explicación, por tanto, tiene dos componentes: (1) Las 
palabras largas son más frágiles, dando lugar a un olvido mayor, y (2) El hecho 
de que las palabras sean redundantes y familiares implica que una parte del 
olvido se puede reparar mediante redintegración. Por supuesto, dos mecanismos 
opuestos como estos permiten explicar muchos resultados post hoc al asignar 
mayor o menor influencia a cada uno de estos factores en competición. 


3.2.5. Mezclando palabras largas y cortas 


Sin embargo, una diferencia crucial entre el bucle fonológico y las hipótesis 
complejas tiene que ver con la cuestión de si el efecto opera localmente, al nivel 
de los ítems individuales, o si es un efecto global del tiempo necesitado para 
recuperar y/o producir toda la secuencia. Si el efecto es local, como supone la 
hipótesis compleja, entonces, independientemente del número o de la mezcla de 
palabras dentro de la secuencia, las palabras largas tenderían a ser peor 
recordadas que las cortas. La hipótesis del bucle fonológico, sin embargo, 
predice que el rendimiento debería depender globalmente del tiempo de 
articulación de la lista completa, y por tanto la exactitud de las palabras tanto 
largas como cortas debería disminuir a medida que aumenta el número de 


palabras largas en la secuencia, y por consiguiente la demora general. Este tema 
fue estudiado por Cowan et al. (2003) y por Hulme et al. (2004) de manera 
independiente, los dos utilizando listas compuestas por una mezcla diferente de 
palabras largas y cortas. 


Los resultados de los dos estudios no proporcionaron apoyo a la hipótesis 
localizada, según la cual, el efecto de longitud de palabra persistiría con una lista 
mixta. De hecho, cuando solo se incluyó una única palabra larga, esta fue 
particularmente bien recordada. Esto es, presumiblemente, un ejemplo del efecto 
de Von Restorff (1933) según el cual, un ítem distinto a los del resto de la lista, 
por estar escrito por ejemplo con un color diferente, o por estar compuesto de 
una letra rodeada de dígitos, será mejor recordado que los ítems de su alrededor. 
La presencia del efecto de Von Restorff en la MCP verbal fue predicha y 
demostrada por Conrad, a raíz del diseño de los códigos postales británicos. Los 
primeros códigos postales se componían de algunas letras y un único dígito (e.g., 
Norwich era NOR, seguido de dos letras y un dígito). Conrad demostró que al 
colocar el dígito en el punto de máximo error, justo en el medio de la secuencia 
de pronunciación de los códigos postales (e.g., NOR 2LK), se optimizaba el 
rendimiento. La peor condición consistía en mezclar las letras y los dígitos, tal 
como hacía la oficina de correos de Canadá. Esto es porque probablemente la 
alternancia dificulta la agrupación en segmentos. Sin embargo, este patrón de 
resultados necesita claramente una interpretación del recuerdo serial más 
compleja que la proporcionada exclusivamente por el bucle fonológico. 


De regreso a las teorías, la interpretación localizada acerca del claro decremento 
del efecto de longitud de palabra en las listas mixtas no estaba en absoluto 
sustentada, pero, ¿acaso lo estaba la predicción sobre la duración total de la 
lista? Cowan et al. concluyeron que sí, mientras que Hulme et al. no encontraron 
ese efecto. Un estudio posterior de Bireta, Neath y Suprenant (en prensa) obtuvo 
el resultado de Cowan et al. con el material de Cowan, pero encontraron que no 
era generalizable a otros conjuntos de palabras, en los que se tendía a mostrar 
que las palabras largas y cortas en las listas mixtas eran igual de bien recordadas 
que las palabras cortas en las listas puras*. Tanto Hulme et al. (2004) como 
Bireta et al. (en prensa) interpretaron que sus resultados están desestimando sus 
interpretaciones previas, y aceptan que ni el modelo propuesto por Brown y 
Hulme (1995) ni la hipótesis del rasgo propuesta por Neath y Nairne (1995) 
podrían dar cuenta de estos resultados. Yo estoy de acuerdo. 


En cambio, ellos proponen interpretar los datos en términos de una nueva 


hipótesis desarrollada por Brown et al. (sin publicar) que ellos denominan 
SIMPLE (Escala Invariante de Memoria, Percepción y Aprendizaje)*. Este es un 
modelo altamente ambicioso que intenta explicar virtualmente todo lo referente a 
la memoria a largo plazo y de trabajo, en términos de la relativa diferenciación 
de los ítems en la recuperación. Asumen que la principal diferencia entre las 
palabras largas y cortas reside en que las palabras cortas se pueden discriminar 
mejor. No está claro por qué debería ser así: de igual manera se podría 
argumentar plausiblemente que las palabras largas, al tener más elementos 
diferenciadores se discriminan mejor. Tampoco se ha intentado medir la 
diferenciación de manera independiente. En su lugar, los autores creen que 
mediante supuestos adecuados se pueden explicar los datos observados. 


En un estudio posterior, Hulme et al. (en prensa) usan un simple diseño en el que 
se comparan listas puras de seis palabras largas o seis palabras cortas, con listas 
compuestas de cinco palabras cortas y una larga, o cinco largas y una corta. En 
estos estudios las listas de palabras largas acompañadas de un solo ítem corto 
tienden a ser recordadas igual de bien que las listas largas puras, mientras que las 
palabras cortas se recuerdan bien independientemente de si forman parte de una 
lista pura o de una lista que contenga una palabra larga. Ellos obtienen un efecto 
Von Restorff dramático, sin embargo, la única palabra larga se recuerda 
significantemente mejor que la corta, y ambas se recuerdan claramente mejor 
que las palabras de cualquiera de las otras condiciones. Un segundo estudio 
proporcionó un cuadro ampliamente comparable, a excepción del efecto Von 
Restorff, que fue mucho menor, se recordó peor la palabra corta de las listas 
mixtas que las de las listas puras. Hulme et al. son capaces de ajustar la mayoría 
de los datos a SIMPLE, pero el modelo aparentemente predice que la palabra 
corta y la larga presentes en las listas mixtas deberían ser recordadas igual de 
bien, lo que no sucede. Sugieren que el modelo podría ajustarse a los datos 
añadiendo un parámetro más, concluyendo que, sin embargo, sus resultados 
«contradicen los modelos que buscan explicar el efecto de longitud de palabra en 
términos de una explicación basada en la velocidad de repaso de la lista» (Hulme 
et al., en prensa). 


¿Cómo de problemáticos son estos datos para la hipótesis del bucle fonológico? 
Ciertamente, en el pasado ocurrió que el modelo del bucle fonológico no 
intentaba dar cuenta del efecto Von Restorff y que la interpretación en términos 
de una marcada discriminación parece plausible, posiblemente siguiendo las 
líneas propuestas para interpretar el efecto recencia en el Capítulo 6. Al igual 
que el efecto recencia, Hendry y Tehan (2005) han demostrado que el efecto Von 


Restorff se extiende más allá de la memoria inmediata hasta el recuerdo 
demorado, lo que ofrece una interpretación distinta a la de Hulme et al. al 
observarse un patrón de errores algo distinto. 


Entonces, ¿qué ocurre con la explicación SIMPLE? Debería comenzar 
admitiendo un prejuicio en contra de los modelos que usan múltiples parámetros 
para ajustarse a los datos a posteriori, como en el caso de Hulme et al. (en 
prensa). Más aún, parece que proponen una serie de posibles parámetros que se 
podrían añadir para solucionar el problema del SIMPLE. Finalmente, como se 
discute en el Capítulo 6, SIMPLE parece fallar cuando se aplica a los datos 
procedentes del recuerdo verbal inmediato que buscan probar explícitamente el 
supuesto de discriminación (Lewandowsky et al. , en prensa; Nimmo y 
Lewandowsky, en prensa). 


Así pues, ¿puede el bucle fonológico realizar un trabajo mejor? Creo que sí, 
primero aceptando que el efecto Von Restorff es un fenómeno genuino y claro 
que aún no ha sido explorado adecuadamente. Una posibilidad es que el ítem 
atípico influya principalmente a través de su impacto fonológico, por ejemplo, 
rompiendo la prosodia de la secuencia, algo que sabemos que tiene un marcado 
efecto en el recuerdo (Ryan, 1969). Otra posibilidad es un efecto atencional, por 
el cual el ítem atípico recibe un mayor procesamiento. Una importante cuestión 
empírica tiene que ver con lo que ocurre cuando desaparece el efecto de longitud 
de palabra con la supresión articulatoria. ¿Desaparece también el efecto Von 
Restorff longitudinalmente basado? Sin embargo, mientras tanto, me gustaría 
sugerir una explicación para uno de los efectos que parece estar creando 
problemas para SIMPLE, concretamente la observación de que el recuerdo de 
una sola palabra larga rodeada de palabras cortas se incrementa, mientras que no 
ocurre así para el caso de una palabra corta rodeada de palabras largas. 


Esto se cumpliría para el caso de una palabra larga rodeada de palabras cortas 
rápidas de pronunciar que a su vez formaran parte de una lista de rápida 
pronunciación. El caso contrario sería el de una única palabra corta rodeada de 
palabras largas, lo que ofrecería una interpretación de los hallazgos de Hulme et 
al. simple y basada en la lista (en prensa). 


Puede ocurrir, sin embargo, que el efecto de longitud de palabra mixto suponga 
un reto para todas las teorías existentes. Aún no se ha aplicado ninguno de los 
modelos computacionales del bucle fonológico a este efecto recientemente 
descubierto. Mientras que la discriminación relativa de los ítems ya juega un 


papel en la mayoría de las teorías, ajustarse a los datos concretos bien puede 
suponer un problema, como lo ha supuesto para SIMPLE. Anticipo un poco de 
animada controversia. 


3.3. Interrumpiendo al bucle fonológico 


Una fuente de evidencia potencialmente poderosa acerca de la naturaleza de la 
memoria verbal inmediata la proporcionan los estudios que intentan interferir en 
su funcionamiento, generando nuevos fenómenos que aportan importantes 
restricciones a las teorías subyacentes. Consecuentemente, esta ha sido un área 
de investigación extremadamente activa y controvertida. Consideraré tres tipos 
de interferencias con la memoria fonológica, concretamente interferencias 
generales de fuentes no verbales, como el tamborileo manual concurrente, 
interferencias más específicas sobre el funcionamiento del bucle como resultado 
de la supresión articulatoria y, finalmente, la interferencia del sonido irrelevante. 
En cada caso, primero presentaré los fenómenos generalmente aceptados, luego 
daré la explicación que proporciona el bucle fonológico, seguida de una 
discusión más detallada sobre los temas más controvertidos. 


3.3.1. Efectos de interferencia general 


Implícitamente, cualquier actividad concurrente puede interferir potencialmente 
con el rendimiento, ya que supone una demanda para nuestra limitada capacidad 
atencional. Por esta razón, una tarea verbal como la supresión articulatoria, que 
se supone que interrumpe específicamente el rendimiento del bucle, se 
acompaña a menudo de una condición control que incluya una tarea no verbal 
concurrente, como dar golpecitos con los dedos. Se supone que tamborilear 
constituye una tarea secundaria que demanda una atención potencial, pero que 
no implica al bucle, lo que ofrece por tanto la posibilidad de separar los efectos 
generales de una carga concurrente, de los efectos específicos de la modalidad. 


Cuando se compara con la amplitud de memoria ejecutada en solitario, los 


efectos de un simple tamborileo pueden ser, bien mínimos (e.g., Meiser y Klauer, 
1999), o bien más sustanciales (Larsen y Baddeley, 2003). En el estudio de 
Meiser y Klauer el incremento de la complejidad del tamborileo incrementó 
claramente su capacidad de interferencia, pero solo tuvo un efecto mínimo 
adicional en el de Larsen y Baddeley. Sin embargo, incrementar la complejidad 
hace que en general el deterioro de la memoria inmediata sea más probable, 
presumiblemente como resultado de un incremento de la demanda atencional. 
Por tanto, es importante tratar de equiparar la complejidad de la tarea de control 
con la complejidad de la tarea concurrente empleada, cualquiera que sea su 
modalidad específica, para garantizar que cualquier interrupción que se observe 
no pueda atribuirse al impacto general de la segunda tarea sobre el ejecutivo 
central (Baddeley y Andrade, 2000; Baddeley et al. , 2001; Meiser y Klauer, 
1999). 


Es importante apuntar que incluso el tamborileo manual puede interrumpir 
específicamente al bucle fonológico cuando implica una sincopación, un 
fenómeno descrito por primera vez por Saito cuando intentaba cantar mientras 
tocaba la guitarra, y posteriormente confirmado de manera experimental (Saito, 
1994; Larsen y Baddeley, 2003). 


Los mencionados efectos del tamborileo sincopado son esencialmente 
equivalentes a los de la supresión articulatoria (ver más abajo). Saito sugiere que 
esta interrupción refleja la dependencia del habla y del ritmo de un proceso 
común de sincronización prosódica. 


3.3.2. Supresión articulatoria 


3.3.2.1. Presentación visual 


David Murray (1968), explorando la relación entre la MCP fonológica y la 
articulación, pidió a sus sujetos que recordaran secuencias de consonantes 
similares o distintas, mientras que al mismo tiempo les pedía que repitieran un 
sonido irrelevante, la palabra «la» (« the»). Esto impidió el recuerdo, pero 
también eliminó la influencia de la similitud fonológica. El descubrimiento es 


fácilmente replicable (Levy, 1971; Peterson y Johnson, 1971), lo que conduce al 
uso de la supresión articulatoria como un método común de interrupción del 
proceso de repaso subvocal (Baddeley, 1986). 


A menudo se ha asumido, al menos implícitamente, que el efecto de supresión es 
o todo o nada, después de que se empleara un amplio rango de articulaciones 
concurrentes, que van desde el inquietante «doble doble», pasando por el alegre 
« hiyah», el « Cola Cola» posiblemente patrocinado, y para los niños, el 
agradable « teddy bear, teddy bear» [«osito de peluche»]. En realidad, la 
naturaleza de la articulación marca una diferencia, particularmente cuando la 
actividad concurrente es en sí misma relativamente demandante, como por 
ejemplo recitar los meses del año (Baddeley et al. , 2001). 


Repetir un solo ítem tiene un marcado efecto, especialmente cuando los ítems 
que hay que recordar se presentan visualmente. Incrementar el número de ítems 
pronunciados pertenecientes a una secuencia muy practicada, como contar del 
uno al nueve, tiene un efecto relativamente poco mayor (e.g., Larsen y Baddeley, 
2003; Meiser y Klauer, 1999). Sin embargo, puede haber un ligero incremento 
del efecto disruptivo cuando se aumenta la complejidad articulatoria (Jones y 
Macken, 1995; Saito, 1997). 


El efecto de supresión parece depender de la necesidad de modular la 
articulación. Por tanto, un único sonido vocal continuo como «aahh» no tiene 
efecto en el rendimiento, mientras que un sonido repetido como «ah», «ab», 
«ah» interrumpe el rendimiento y elimina el efecto de similitud fonológica 
(Saito, 1997). Se encontró un resultado similar con un silbido continuo frente a 
uno repetido (Saito, 1998), sugiriendo que la articulación vocal no es necesaria 
para que haya interrupción. 


En conclusión, no hay duda de que la supresión articulatoria interrumpe 
seriamente el recuerdo verbal inmediato y serial del material presentado 
visualmente. Larsen y Baddeley, por ejemplo, encuentran una interrupción del 37 
por ciento cuando la supresión implica repetir el dígito «dos» a una velocidad 
constante de dos veces por segundo, el 41 por ciento cuando lo repiten con un 
patrón sincopado y 42 por ciento cuando se cuenta del uno al seis repetidamente, 
desapareciendo por completo el efecto de similitud fonológica en las tres 
condiciones. 


3.3.2.2. Presentación auditiva 


En contraste con la presentación visual, cuando las secuencias se presentan 
auditivamente, el efecto de similitud fonológica permanece. La hipótesis del 
bucle fonológico predice este resultado basándose en que la presentación 
auditiva da lugar a un registro directo del estímulo dentro del almacén 
fonológico, sin necesidad de que haya una articulación subvocal. La supresión, 
sin embargo, reduce el rendimiento al interferir con el repaso. Finalmente, es 
importante apuntar que incluso en la condición de mayor interrupción, en la que 
la presentación es visual y en la que aparentemente se está impidiendo la 
recodificación fonológica mediante la supresión articulatoria, los sujetos siguen 
recordando una media de tres o cuatro dígitos, lo que sugiere la necesidad de que 
una O más fuentes estén contribuyendo de forma sustancial a la amplitud de 
dígitos. Volveremos a este tema en el Capítulo 8. 


3.4. El efecto del habla no atendida 


3.4.1. ¿Un caso de enmascaramiento mnemónico? 


Colle y Welsh (1976) parecen ser los primeros en apuntar que la memoria 
inmediata para dígitos presentados visualmente se podía interrumpir si se 
presentaba simultáneamente habla no atendida, en este caso, prosa pronunciada 
en alemán, un idioma extranjero, no familiar para sus sujetos estudiantes. En este 
estudio y en el posterior, Colle (1980) observó que el efecto no parecía ser 
resultado de una simple distracción, puesto que no se observó un efecto con 
ruido blanco, el habla simultánea se pronunciaba en un idioma no familiar, y el 
volumen de ruido no tuvo impacto en su capacidad de interrupción, lo que le 
hizo describir sus hallazgos como un «enmascaramiento auditivo en la memoria 
primaria» (Colle, 1978). 


Estos resultados fueron ampliados por Salamé y Baddeley (1982), quienes en 
este estudio y en los posteriores tampoco encontraron efecto del volumen de 


sonido, ni del ruido blanco, incluso cuando se escuchaba con la misma 
intensidad envolvente que el habla. Tampoco encontramos diferencias en el 
efecto disruptivo de palabras con sentido, sílabas sin sentido, ni incluso con la 
pronunciación de dígitos irrelevantes, sobre el recuerdo de dígitos (Salamé y 
Baddeley, 1982; 1986; 1989). Sin embargo, sí observamos que el rendimiento 
bajaba con la música vocal, y en menor medida, al menos en nuestros estudios, 
con la música instrumental (Salamé y Baddeley, 1989), y con las fluctuaciones 
de sonidos complejos (Salamé, 1990). 


En un nivel más teórico, eliminamos la posibilidad de que el efecto operara a un 
nivel léxico, gracias a nuestra demostración de que el recuerdo de una secuencia 
de dígitos no se veía más deteriorado por la pronunciación de una secuencia 
irrelevante de dígitos de lo que se deterioraba si se pronunciaban palabras 
construidas a partir de los mismos fonemas (e.g., en vez de one-two, etc., tun- 
woo, etc.). También observamos que mediante la presentación visual, la 
supresión articulatoria eliminaba el efecto del habla no atendida. Interpretamos 
este resultado sugiriendo que el efecto del habla no atendida operaba a través del 
almacén fonológico, el cual no se usaba con la supresión, lo que impedía que los 
ítems visuales se registraran dentro del almacén (Salamé y Baddeley, 1982). Una 
característica de nuestros resultados que parecía estar apoyando la hipótesis del 
enmascaramiento mnemónico sugerida por primera vez por Colle (1980) fue que 
la interferencia era ligeramente menor aunque significativa para palabras 
disilábicas que para monosilábicas, un hallazgo que nosotros sugerimos que 
podía atribuirse a que las palabras disilábicas eran fonológicamente menos 
similares a los dígitos monosilábicos, dando lugar por tanto a un menor 
enmascaramiento auditivo. 


Esta hipótesis demostró ser errónea. Investigaciones más exhaustivas centradas 
específicamente en este tema no han demostrado evidencias de ningún efecto de 
similitud entre el material a recordar y el material auditivo a ignorar (Jones y 
Macken, 1995; Larsen et al. , 2000; Le Compte y Shaibe, 1997), así como 
tampoco se ha replicado el descubrimiento inicial de que las palabras disilábicas 
interrumpan menos (Le Compte y Shaibe, 1997). Por tanto, la simple 
interpretación del enmascaramiento mnemónico sobre el efecto del habla no 
atendida no se ha visto apoyada. Una conclusión similar se extrajo de un estudio 
(Salamé y Baddeley, 1990) que intentaba poner a prueba el enmascaramiento 
mnemónico de manera más directa, combinando la similitud fonológica con el 
habla no atendida. Defendíamos que si el habla no atendida añadía «ruido 
enmascarado» a la huella de memoria, entonces esto debería tener un efecto 


particularmente marcado sobre las secuencias fonológicamente similares, que 
supuestamente eran difíciles precisamente porque tenían menos elementos 
diferenciadores, y eran por tanto más vulnerables a la interrupción. Los sujetos 
recordaban secuencias de consonantes seleccionadas, de un conjunto 
acústicamente similar, o bien de uno distinto. Realizaban esta tarea, bien en 
silencio, o bien con habla no atendida. 


De este estudio surgieron dos importantes resultados. El primero fue que los 
efectos de la similitud fonológica desaparecían en las secuencias de larga 
duración, un hallazgo que se había observado en otros contextos, y que se había 
interpretado sugiriendo que cuando el bucle fonológico ya no es capaz de 
soportar la cantidad de material presentado, los sujetos buscan estrategias 
alternativas (Baddeley, 2000; Hall et al. , 1983; Johnston et al. , 1987). Esto 
implica que las secuencias largas son inapropiadas para el estudio del bucle 
fonológico, un punto que se repite a lo largo de esta revisión. Sin embargo, el 
resultado principal del estudio fue que en duraciones intermedias, cuando los 
efectos techo y suelo se evitaban, el efecto de similitud fonológica se sumaba al 
del habla no atendida, un resultado claramente inconsistente con la predicción 
del enmascaramiento mnemónico, según la cual, el habla no atendida debería ser 
más disruptiva con secuencias similares. 


En este punto, sin embargo, estaba claro que cualquier interpretación adecuada 
del efecto del habla no atendida requeriría un modelo más completo que el 
proporcionado por el bucle fonológico, especificado en términos puramente 
verbales. En concreto, cualquier modelo adecuado necesitaría proporcionar un 
relato convincente acerca de cómo se almacena y cómo se recupera en orden 
serial. Tristemente, esta rectificación de la hipótesis del enmascaramiento 
mnemónico (Salamé y Baddeley, 1986) parece haber calado en las mentes 
colectivas con mucha menos firmeza que la especulación original, la cual se ha 
consagrado ahora como clara predictora de la hipótesis del bucle fonológico 
(Jones y Macken, 1995; Neath, 2000). El fallo de la sencilla hipótesis del 
enmascaramiento mnemónico es importante porque proporciona una valiosa 
limitación teórica de los modelos de MCP. Sin embargo, como veremos más 
tarde, está abierta a un gran número de interpretaciones, muchas de las cuales 
caen dentro del alcance de la hipótesis del bucle fonológico. Las discutiremos 
más tarde. 


3.4.2. La hipótesis del cambio de estado 


Mientras que yo aguardaba esperanzado a la llegada de un modelo del bucle 
fonológico más sofisticado y computacionalmente explícito, un nuevo grupo se 
introdujo en el campo del habla no atendida, y lo dominó durante los siguientes 
próximos años. Dylan Jones (1993) empezó a investigar sistemáticamente qué 
características del sonido determinarían su interferencia en el recuerdo verbal 
inmediato. Él y sus colegas demostraron muy claramente que incluso un sonido 
tan simple como un tono puro fluctuante era suficiente para interrumpir la 
memoria, haciéndole sugerir muy razonablemente que el fenómeno se debería 
denominar el efecto del sonido irrelevante. Demostraron que un único tono 
repetido no solía causar una interrupción fiable de la memoria (Jones y Macken, 
1993; Jones et al. , 1993). Exactamente el mismo patrón parecía funcionar para 
los sonidos hablados, ya que, típicamente, un solo ítem tenía poco o ningún 
efecto (Jones et al. , 1997; Tremblay et al., 2000; Larsen y Baddeley, 2003). 
Tremblay y Jones (1998) investigaron qué efecto tenía sobre el recuerdo de 
dígitos el incremento del número de letras irrelevantes pronunciadas, hallando 
un marcado aumento del efecto al pasar de uno a dos ítems irrelevantes, y una 
disminución del efecto al ir añadiendo más ítems. 


Como explicación a estos resultados, Jones (1993) propuso la hipótesis del 
cambio de estado. Relacionó sus resultados con el análisis auditivo de la escena 
(Bregman, 1990), argumentando que los elementos que causaban interrupción 
eran aquellos que uno esperaría que fueran un solo «objeto auditivo», mientras 
que las condiciones que no creaban interrupción, como la repetición de un único 
ítem o el ruido blanco no ocasionarían la percepción de un objeto auditivo 
integrado y, por tanto, no interrumpirían la memoria de secuencias, en contraste 
con la pronunciación de una palabra o la fluctuación, que sí que lo harían. Estos 
sonidos irrelevantes, al igual que la secuencia a recordar, estarían representados 
por una trayectoria a través de un campo sensorial multidimensional, el cual él 
denomina Registro Episódico de Objetos-Orientados (O-OER)*. Así, la 
presencia de una trayectoria no atendida interrumpiría la recuperación de los 
ítems a recordar. 


3.4.3. El modelo de registro episódico de objetos-orientados 


Jones rechaza el supuesto de que los sistemas de MCP visoespacial y verbal 
estén separados, y refuerza su idea demostrando que el habla no atendida 
interrumpe una tarea que implique recuerdo secuencial visual a corto plazo 
(Jones et al., 1995). Más recientemente, Meiser y Klauer (1999) realizaron un 
estudio comparando la tarea de recuerdo de dígitos estándar con una tarea de 
memoria espacial convencional, la del procedimiento de los bloques de Corsi, en 
la que los sujetos observan e intentan reproducir una secuencia de golpecitos en 
una serie de bloques espaciales ordenados. Encontraron una disociación doble 
muy Clara, la tarea visoespacial se veía interrumpida principalmente por los 
golpecitos espaciales más que por la supresión articulatoria, mientras que la 
amplitud de dígitos mostró el patrón opuesto, justo lo que hubiera predicho la 
teoría sobre memoria de trabajo. Además, se encontró una interrupción general 
que afectaba a las distintas modalidades, y que se incrementaba con la 
complejidad de la tarea concurrente. Los autores demostraron que se podía 
interpretar más fácilmente como un efecto de interrupción del ejecutivo central. 


A pesar de la defensa que hace Jones de un único sistema de MCP multimodal, 
hay por supuesto muchas más evidencias de la separación de los sistemas de 
MCP visoespacial y fonológico (ver Capítulos 4, 5 y 10). Las fuentes incluyen 
datos procedentes de pacientes neuropsicológicos (Della Sala y Logie, 2002; 
Vallar y Papagno, 2002), de sujetos normales (e.g., Brooks, 1967; Logie et al. , 
1990) y de estudios con imágenes funcionales (Smith et al. , 1996). Más aún, no 
está claro que la hipótesis O-OER necesite asumir realmente una superficie 
común para la memoria visual y verbal, aunque Jones parece seguir manteniendo 
esta postura. Por supuesto, es posible presentar el caso de un almacén adicional 
de memoria a corto plazo multimodal. Precisamente el búfer episódico propuesto 
recientemente representa justamente este almacén (ver Capítulo 8), pero Jones 
(comunicación personal) mantiene que este no debería identificarse con su 
concepto del registro episódico de objetos orientados. 


Así pues, surge la cuestión adicional de si, tal como proponen Neath (2000) y 
Jones et al. (1996), la supresión articulatoria y el habla no atendida tienen un 
origen común. Habría una serie de claras diferencias. Primero, mientras que 
repetir un solo ítem es tan disruptivo como repetir seis, esto no sucede con el 
habla no atendida, en la que un ítem apenas tiene efecto, dos ítems tienen un 
efecto muy claro y seis ítems un efecto un poco mayor (Larsen y Baddeley, 
2003; Tremblay et al., 2000). La hipótesis del bucle fonológico es capaz de dar 


una sencilla explicación acerca de las condiciones bajo las cuales interactúan 
entre sí el habla no atendida, la supresión articulatoria bajo condiciones 
constantes y sincopadas, la similitud fonológica y la longitud de palabra. Por el 
momento el modelo O-OER no ha prestado mucha atención a otro fenómeno 
más que al del sonido irrelevante, por lo que posiblemente podría ofrecer un 
relato simple y coherente, aunque aún no parece haberlo logrado. 


En su mayor parte, Jones y su grupo se han concentrado ampliamente en el 
efecto del sonido irrelevante, apuntando justificadamente que el actual modelo 
del bucle fonológico no intenta especificar exactamente qué características 
acústicas hacen que el sonido interfiera. Más aún, los modelos computacionales 
del bucle fonológico han tendido a ignorar los efectos del sonido irrelevante, 
aunque hay indicios de que esto está empezando a cambiar gracias a la 
interpretación propuesta desde de la hipótesis de primacía que ofrecen Page y 
Norris (2003). 


3.4,4. ¿El bucle fonológico desenmascarado? 


El tema se ha avivado gracias a una serie de experimentos realizados por Jones y 
colegas (Jones et al. , 2004; 2006), que parecen socavar todo el concepto de 
almacenamiento fonológico a corto plazo. En lugar de un bucle fonológico, que 
describen como «organización perceptiva disfrazada de almacén fonológico», 
proponen una «visión perceptiva-gestual» de la memoria a corto plazo (Jones et 
al. , 2006). Su ataque se basa en una interesante interpretación alternativa acerca 
de una interacción triple entre los efectos de similitud, modalidad de 
presentación y supresión articulatoria, sobre el rendimiento en la MCP, la cual 
correctamente identifican como una importante fuente de evidencia para la 
hipótesis del bucle. 


Debe recordarse que los ítems fonológicamente similares como las letras 
deterioran el rendimiento cuando se presentan visual o auditivamente, excepto 
cuando al sujeto se le impide articular, en cuyo caso el efecto desaparece con los 
ítems visuales pero no con los auditivos. Se supone que el efecto de similitud 
fonológica es una seña de identidad del almacenamiento dentro del almacén 
fonológico. Cuando la presentación es visual, la supresión impide que la 


codificación fonológica sea registrada dentro del almacén: cuando la 
presentación es auditiva, esta gana un acceso directo al almacén, de manera que 
en este último caso seguiríamos esperando la presencia del efecto de similitud 
fonológica, aunque probablemente el nivel de rendimiento general se vería 
deteriorado si se previene el repaso. 


Jones et al. (2004), estudiando el recuerdo inmediato de secuencias de siete 
letras similares o distintas, observaron en su estudio que la aparición del efecto 
de similitud fonológica bajo las condiciones de supresión y presentación auditiva 
quedaba limitado en su mayor parte al rendimiento en los dos últimos ítems (ver 
Fig. 3.2). Ellos sugieren que este es un efecto puramente sensorial, del tipo 
previamente estudiado, y Crowder y Morton (1969) lo atribuyen a lo que ellos 
denominan Almacenamiento Acústico Precategorial (AAP). En línea con esta 
interpretación, mostraron que si la secuencia se acompañaba con la 
pronunciación de un sufijo, el efecto se eliminaba ampliamente. Se continuó con 
esta interpretación en un estudio posterior (Jones et al. , 2006) en el que se 
usaron listas de cinco ítems y en el que se demostró que la similitud fonológica 
de los ítems con el material presentado auditivamente se podía eliminar 
combinando la supresión articulatoria con la pronunciación de un prefijo y un 
sufijo pronunciados en la misma voz que los ítems que se tenían que recordar. 
Ellos proponen reemplazar el concepto de almacén fonológico por el de 
organización perceptiva, junto con un proceso de repaso basado en una 
«planificación gestual», la cual se supone que es la base del efecto de similitud 
fonológica. 
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Fig. 3.2. Los efectos de la similitud fonológica sobre el recuerdo de secuencias 
de consonantes bajo supresión articulatoria. Se observa el efecto de similitud 
cuando la presentación es auditiva según predice la hipótesis del bucle 
fonológico, pero solo en el componente de recencia. Datos de Jones et al. (2006). 


No hay duda de que el efecto identificado por Jones y colegas supone un reto 
para las hipótesis existentes, especialmente dado que la mayoría de la 
investigación previa en esta área no ha proporcionado datos sobre la posición 
serial. La excepción la da Murray (1968), que encuentra el efecto crucial a través 
de la curva de posición serial, pero cuyos datos son rechazados por Jones et al. 
por estar basados en un método atípico. Sin embargo, una razón mayor para 
dudar de la generalidad de los descubrimientos referidos por Jones tiene que ver 
con que ellos representan el rendimiento bajo condiciones en las que el bucle 
fonológico es probable que se encuentre muy estresado, y en las que existe 
considerable investigación que indica que la codificación fonológica tiende a ser 
abandonada. Este fenómeno estaba en el corazón de una importante controversia 
relacionada con el uso que hacen los buenos y malos lectores de la codificación 
fonológica; el equipo de Haskins (e.g., Shankweiler et al. , 1979) observó claros 
efectos de similitud fonológica en la MCP para el grupo de buenos lectores, pero 
no para el grupo de malos lectores. Posteriormente se demostró que esto se debía 
a que los malos lectores tenían amplitudes más bajas que los buenos lectores, y 
ambos grupos usaban la codificación fonológica con longitudes en las que el 
rendimiento era bueno, pero aparentemente la abandonaban cuando el 
rendimiento se situaba por debajo de un determinado nivel (Hall et al. , 1983; 
Johnston et al. , 1987). Esto está relacionado con el estudio de Salamé y 
Baddeley (1986) descrito previamente, en el que se encontraron efectos claros y 
aditivos del habla no atendida y de la similitud fonológica en listas de longitudes 
inmediatas, pero ambos con tendencia a desaparecer cuando el rendimiento se 
situaba por debajo del 50 por ciento. Todos los casos en los que Jones et al. 
(2004; 2006) muestran una completa ausencia de codificación fonológica en las 
zonas iniciales de la lista se dan en condiciones en las que el rendimiento está 
alrededor del 50 por ciento o menor. 


Afortunadamente, Jan Larsen y yo hemos estado llevando a cabo de manera 
independiente una serie de experimentos en los que sistemáticamente 


estudiábamos un conjunto de variables bajo presentación tanto visual como 
auditiva. Estas incluían retener secuencias de seis ítems similares y no similares 
presentadas con y sin supresión articulatoria (Baddeley y Larsen, en prensa a). 
Tenemos un gran número de datos, y todos ellos coinciden consistentemente en 
la presencia de un efecto sustancial de la similitud fonológica sobre el recuerdo 
cuando la presentación es auditiva. En un estudio usamos la supresión 
articulatoria, mientras que en otro usamos el movimiento silencioso de los 
labios, que según Murray (1967) es eficaz en la supresión articulatoria, 
impidiendo así la objeción de que el estímulo pudiera haber sido enmascarado 
por la vocalización de los sujetos. Los resultados de este último estudio se 
muestran en la Fig. 3.3, donde claramente se observa que, mientras que con 
presentación visual y supresión el efecto de similitud está ausente, sí que se 
observa un efecto robusto a lo largo de la lista cuando la presentación es 
auditiva. 


Claramente, el efecto no está limitado a los dos últimos ítems, como Jones et al. 
decían. (Pero leer Jones et al. , en prensa, para una interpretación contraria.) 


Al igual que Jones et al., nosotros encontramos un efecto adicional de la 
modalidad sobre los ítems no similares, pero no sobre los ítems similares, un 
efecto que en nuestro caso sobrevive a una demora de diez segundos antes de 
pedir el recuerdo, que se rellenó repitiendo silenciosamente con los labios el 
ítem «de»*, Tanto la supervivencia del efecto tras una demora (Crowder, 1978a) 
como la ausencia de recencia auditiva para el material similar ya han sido 
descritas previamente (Crowder, 1978b; Darwin y Baddeley, 1974). Este último 
descubrimiento conlleva interesantes implicaciones para cualquier intento de 
proporcionar una hipótesis unitaria que cubra el recuerdo verbal inmediato y 
serial. Como apuntábamos anteriormente, el efecto del sonido irrelevante no se 
ve influido por ningún tipo de similitud fonológica entre los ítems a recordar y 
los sonidos disruptivos, lo que contrasta con el efecto de la modalidad tal como 
Jones et al. (2006) refirieron, en el que la similitud sí influye en las etapas finales 
de producción del habla, como demostraron Saito y Baddeley (2004). En 
resumen, aunque estoy seguro de que la controversia continuará, y demostrará 
ser fructífera a la hora de comprender cuándo se emplea el bucle y cuándo no, no 
veo ninguna razón por la que se deba cambiar el modelo básico del bucle 
fonológico (Baddeley y Larsen, en prensa b). 
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Fig. 3.3. Recuerdo de secuencias de seis consonantes bajo supresión 
articulatoria. Con la presentación auditiva, se observa la presencia del efecto de 
similitud a lo largo de la lista. Datos de Larsen y Baddeley (en prensa a). 


En conclusión, aunque no hay duda de que Jones y colegas han proporcionado 
una contribución empírica sustancial, concretamente detallando qué 
características de los sonidos causan interferencia con el almacenamiento 
fonológico, su teoría posee importantes limitaciones, entre las que se incluyen: 


1. Asume una interpretación encadenada del recuerdo serial, que es inconsistente 
con gran parte de las evidencias (ver Capítulo 2, p. 46). 


2. Su desarrollo está ampliamente basado en el efecto del sonido irrelevante, y 
tiene poco que decir sobre otros fenómenos. 


3. Su supuesto de un sistema multimodal único es inconsistente con los datos de 
Otros grupos. 


4. Con datos procedentes de la neuropsicología y de la neuroimagen. 


5. Sigue existiendo una explicación verbal vagamente especificada que no 
parece prestarse a un modelo más preciso. 


6. Al contrario que el bucle fonológico, ha tenido poco impacto en la psicología 
de laboratorio. 


Sin embargo, en el ámbito del sonido irrelevante, no hay duda de que el modelo 
O-OER y la hipótesis del cambio de estado han demostrado ser extremadamente 
fructíferos. Más aún, supone una gran ventaja asumir algún tipo de 
almacenamiento multimodal a corto plazo, como se reflejó en mi propio 
supuesto del búfer episódico (Baddeley, 2000), un concepto que fácilmente se ha 
podido ver influido por las discusiones con Dylan Jones, aunque el propio Dylan 


niegue esa responsabilidad. Afortunadamente, creo observar cierta convergencia 
en las perspectivas. A pesar de las diferencias que él señala entre su propia 
aproximación y el modelo de memoria de trabajo (Jones et al. , 2006, p. 278), se 
puede apreciar que sus actuales perspectivas tienen mucho en común con el 
bucle fonológico, aunque estén expresadas en términos que favorecen la 
percepción sobre la memoria, menospreciando el concepto de bucle fonológico 
como una «reificación». Me declaro culpable de los cargos. Creo que las 
funciones dependen de estructuras a un nivel teórico y conceptual, y que estas 
estructuras se dibujan sobre el funcionamiento de un objeto físico, el cerebro. 


3.4.5. El habla no atendida y la hipótesis del rasgo 


La hipótesis del rasgo fue diseñada inicialmente para dar cuenta de los breves 
efectos de la memoria sensorial, junto con el recuerdo inmediato de listas, 
algunas veces de ocho o nueve palabras, a diferencia del bucle fonológico que no 
se dirige a la memoria sensorial, y de la sustancial MLP, que se emplea más con 
listas por encima de las cinco o seis palabras. Neath (2000) escribió un 
inspirador artículo en el que aplicó la hipótesis del rasgo a datos procedentes del 
habla no atendida, observando que la hipótesis predecía una serie de 
interacciones que aparentemente no eran predichas por el bucle fonológico o por 
la hipótesis O-OER. Entre estas predicciones se incluía una interacción con la 
longitud de palabra, de forma que los efectos del habla no atendida eran 
inexistentes con palabras largas. Por el contrario, la hipótesis del bucle 
fonológico predice un claro efecto, siempre que las listas sean lo suficientemente 
cortas como para que la estrategia fonológica sea efectiva, ya que no lo es con 
longitudes largas, como las que usan Neath et al. (1998). 


Se formuló una predicción parecida para el caso de la similitud fonológica, la 
cual, según Neath, eliminaba el efecto del habla no atendida. Sin embargo, tal 
como mostraron Salamé y Baddeley (1986), cuando se evita el efecto techo y 
suelo, el efecto del habla no atendida y el de la similitud fonológica son aditivos. 
Los efectos solo desaparecen cuando la longitud de la lista aumenta (Hanley y 
Broadbent, 1987; Hanley, 1997). Otra predicción de Neath (2000) era que 
cuando la presentación fuera auditiva no debería aparecer el efecto del habla no 
atendida. Sin embargo, los estudios de Hanley y Broadbent (1987) mostraron 


que con listas de longitudes moderadas sí que aparecían efectos claros del habla 
no atendida. En un estudio posterior, Hanley y Bakopoulou (2003) mostraron 
que el efecto del habla no atendida se podía dar incluso con listas largas, siempre 
que se instruyera a los sujetos para que usaran el repaso articulatorio. Estos 
efectos desaparecen cuando se anima a utilizar la codificación semántica. 


Finalmente, la interpretación de la hipótesis del rasgo sobre el efecto del habla 
no atendida requiere que la voz disruptiva se dé al mismo tiempo que se presenta 
el material a recordar. Sin embargo, hay una clara evidencia de interrupción del 
habla no atendida que aparece solo después de haber presentado los ítems a 
recordar (Macken y Jones, 1995), un efecto que ocurre incluso cuando se impide 
el repaso, de forma que se previene así cualquier posibilidad de coocurrencia de 
los ítems a recordar con el habla no atendida (Norris et al. , 2004). 


Por tanto, parece que la hipótesis del rasgo comete errores de predicción sobre 
los efectos de la presentación auditiva, longitud de palabra, similitud fonológica 
y simultaneidad. Como se discutía anteriormente, la hipótesis del rasgo también 
tiene dificultades para dar cuenta de la ausencia del efecto de longitud de palabra 
en listas mixtas con palabras cortas y largas (Cowan et al. , 2003; Hulme et al. , 
2004). La hipótesis del rasgo es quizá más exitosa a la hora de tratar otros 
componentes de la memoria de trabajo como el búfer episódico (ver Capítulo 8), 
el cual, dada su complejidad y su naturaleza multidimensional, es probable que 
tenga más en común con los mecanismos de la MLP, que parecen haber influido 
en el desarrollo de la hipótesis del rasgo. 


3.5. El bucle fonológico: una visión general 


Una de las ventajas de estudiar el bucle fonológico es que su formulación teórica 
se ciñe a una gran cantidad de datos empíricos muy robustos. El intento de 
explicar de forma plausible cada uno de los datos proporciona alguna idea de 
dónde residen los puntos fuertes y débiles del modelo del bucle fonológico y, por 
tanto, si deberíamos ampliarlo o abandonarlo. Los distintos fenómenos se 
discutirán por orden. 


1. Efecto de similitud fonológica. Asumo que las secuencias de palabras o de 
consonantes se registran en el almacén fonológico, un sistema de 
almacenamiento temporal subléxico. Los ítems se unen a una serie de indicios 
contextuales, temporalmente basados (Brown y Hulme, 1995; Burgess y Hitch, 
1999), o bien basados en indicios sobre la posición serial (Henson, 1998; Page y 
Norris, 1998). Los ítems se almacenan siguiendo una serie de rasgos 
fonológicos, en los que los sonidos vocales son dominantes. Los ítems 
fonológicamente similares tendrán muchas características comunes, y en 
consecuencia será más probable perderles la pista. Sigo asumiendo que hay un 
desvanecimiento de la huella, que ofrece por el momento la explicación más 
sencilla, independientemente de si el olvido es resultado de un decaimiento 
espontáneo o de un algún tipo de desplazamiento o interferencia, aunque por 
supuesto este hecho lo cambiaría todo en gran medida. Los efectos de la 
lexicalidad, la codificación semántica y el proceso o procesos de redintegración, 
funcionan supuestamente durante el proceso de recuperación desde el almacén 
fonológico, posiblemente de forma automática, y/o como una etapa de 
comprobación postrecuerdo a la que probablemente accede el control ejecutivo. 


2. Efecto de la longitud de palabra. Sigo manteniendo que este efecto es 
consecuencia del olvido como resultado de una demora en el repaso y en la 
salida. Esto ocurre porque la información codificada fonológicamente se disipa a 
lo largo del tiempo (decaimiento de la huella), o bien como resultado de la 
interferencia de una actividad interpuesta. Decidirse entre el desvanecimiento o 
el desplazamiento sigue suponiendo un difícil desafío. 


3. Supresión articulatoria. Sigo proponiendo que previene tanto el repaso 
subvocal como el registro en el almacén fonológico del material visualmente 
presentado. Como discutíamos antes, incluso una simple repetición implica 
añadir una tarea concurrente, también hay por tanto una posible carga adicional 
del ejecutivo central que dependerá de la complejidad y grado de 
sobreaprendizaje de la tarea de supresión (ver Baddeley et al. , 2001). A 
diferencia de su efecto específico, que está limitado a tareas 
fonológicas/verbales, la interrupción del ejecutivo puede influir en la memoria 
visual y, de hecho, puede influir en cualquier tarea que suponga una demanda de 
control atencional. La supresión interactúa con la similitud fonológica solo bajo 
presentación visual, ya que impide la recodificación fonológica de los estímulos 
visuales. El material auditivo gana un acceso directo al almacén fonológico sin 
necesidad del repaso subvocal. Por tanto, la similitud fonológica seguirá 
deteriorando el rendimiento de la memoria. 


4. Efecto del sonido irrelevante. Este efecto plantea dos cuestiones separadas 
pero relacionadas. Primero, ¿qué es lo que determina que un determinado sonido 
interrumpa o no interrumpa el recuerdo serial? Y segundo, ¿cómo ocurre esta 
interrupción? Estoy ampliamente de acuerdo con la hipótesis del cambio de 
estado propuesta por Jones (e.g., Jones, 1993; Jones et al. , 1996), puesto que da 
buena cuenta de los sonidos que interrumpen y de los que no interrumpen la 
memoria, y también simpatizo con su intento de unir esta hipótesis con la 
percepción auditiva de la escena. Como se discutió anteriormente, sin embargo, 
no creo que ni la hipótesis O-OER propuesta por Jones (1993) ni la hipótesis del 
rasgo de Neath (2000) proporcionen un relato convincente de toda la gama de 
datos sobre memoria. La interpretación propuesta por Page y Norris (2003) 
parece ser más probable, ellos proponen que el sonido irrelevante interrumpe el 
proceso de unión de los ítems con los indicios acerca del orden serial, bien 
porque añaden «ruido» o bien por la necesidad de inhibir o apaciguar el sistema 
para impedir que los ítems irrelevantes ganen un acceso automático al sistema de 
memoria fonológica (Gisselgard et al. , 2003). 


5. Redintegración y la influencia de la MLP. Implícitamente, todos los 
fenómenos discutidos hasta ahora dependían del almacén fonético subléxico. Por 
supuesto existen muchos fenómenos que señalan el impacto de los factores a 
largo plazo sobre la amplitud de la memoria inmediata, entre los que se 
encuentra la ventaja de las palabras sobre las no palabras (Gathercole et al. , 
2003), las palabras de alta frecuencia sobre las de baja frecuencia (Hulme et al. , 
1997) y los efectos positivos del grado de concreción de las palabras (Walker y 
Hume, 1999), al igual que existen factores a largo plazo subléxicos, como el 
parecido entre palabras (Gathercole, 1995). Todos influyen claramente en el 
resultado de las tareas de memoria inmediata, y se podrían considerar 
razonablemente como parte del mecanismo implicado en el proceso de 
recuperación a partir del bucle fonológico. Sin embargo, se extienden más allá 
del exclusivo ámbito del bucle fonológico, y se discutirá en el Capítulo 8. 


3.6. Conclusión 


Después de más de 30 años, la hipótesis del bucle fonológico continúa siendo 
controvertida, sin embargo, sigue dando cuenta de manera relativamente simple, 


de una gran cantidad de descubrimientos robustos procedentes de cuidadosos 
estudios de laboratorio. Ha demostrado ser un terreno muy fructífero para el 
modelado computacional. Finalmente, como se ha ilustrado en el capítulo 
anterior, ha proporcionado un modelo básico fácilmente comprensible, 
acompañado de un conjunto de flexibles aunque robustas tareas, que han 
permitido poder aplicarlo más allá del laboratorio hasta terrenos evolutivos, 
educativos, neuropsicológicos y de neuroimagen. 


Sin embargo, sigue habiendo importantes áreas del modelo del bucle fonológico 
que requieren un mayor desarrollo, entre las que se incluyen: 


1. Necesitamos saber más acerca de las condiciones bajo las cuales se utiliza el 
bucle, y si su aparente abandono con el incremento de la longitud de la secuencia 
y de la dificultad representa una elección estratégica o es simplemente una 
saturación de su funcionamiento debido a la sobrecarga. 


2. La cuestión sobre cómo se almacena en orden serial no está del todo 
comprendida. 


3. ¿Se pueden modificar los modelos computacionales existentes para tratar los 
procesos de agrupación en segmentos tanto a un nivel subléxico como 
supraléxico? 


4. ¿Cómo se relaciona esto con el papel del bucle fonológico en la adquisición y 
el uso del lenguaje? 


Notas al pie 


* Listas formadas solo por palabras cortas. N. de la T. 


* SIMPLE es un acrónimo de las palabras en inglés: Scale Invariant Memory, 
Perception and Learning. N. de la T. 


* Las siglas O-OER se corresponden con el término en inglés: « Object-Oriented 
Episodic Record». N. de la T. 


CAPÍTULO 4 


Memoria a corto plazo visoespacial 


Se ha descrito la agenda visoespacial (AVE) como el componente de la memoria 
de trabajo más descuidado (Pearson, 2001). Esto puede parecer sorprendente, 
dado que se supone que funciona como interfaz entre la visión, la atención y la 
acción. La investigación sobre la visión es uno de los campos más extensos y 
bien establecidos de la psicología, y su interfaz con la atención es un área de 
considerable interés, que se apoya fuertemente tanto en la psicología cognitiva 
como en estudios de neuroimagen y estudios neurobiológicos con animales. Esto 
representa una ventaja importante en comparación con el bucle fonológico 
basado lingiísticamente, que no está precisamente caracterizado en el reino 
animal. Aunque la memoria icónica constituye una de las áreas clásicas a partir 
de la cual se ha desarrollado la psicología cognitiva, sus breves procesos de 
almacenamiento visual periférico se han considerado más relevantes para la 
percepción que para la memoria. Es más, típicamente los investigadores de la 
memoria han encontrado más sencillo manipular material y poner a prueba 
teorías utilizando ítems verbales, que implicarse en las exquisiteces de un control 
preciso de los estímulos visuales. Consecuentemente, aunque ha habido un gran 
número de áreas relativamente bien desarrolladas de relevancia para la AVE, 
hasta hace poco han tendido a funcionar mayoritariamente en solitario, a partir 
de aproximaciones psicofísicas que caracterizan una gran parte de la 
investigación sobre la visión. 


4.1. El caso de una memoria de trabajo visoespacial y verbal por separado 


Un punto de partida lógico es la cuestión de la necesidad de asumir un sistema 
específico responsable de retener la información visual o espacial a corto plazo. 
Mientras que generalmente se ha aceptado que el almacenamiento temporal de la 


información verbal y visoespacial se hace a través de diferentes sistemas, esta 
opinión no está universalmente aceptada. Como se discutió antes, Jones y 
colegas han propuesto un único sistema unitario, basándose principalmente en 
las similitudes detectadas en cuanto a la manera en que se retienen los ítems 
visuales y visoespaciales a lo largo de intervalos cortos (Farrand y Jones, 1996; 
Jones et al. , 1995). Como se discutió anteriormente, su propuesta de que el 
sonido irrelevante tiene un efecto similar en el recuerdo inmediato verbal y 
espacial no ha demostrado ser fácilmente replicable (Meisser y Klauer, 1999), y 
como veremos más adelante, a pesar de que la supresión articulatoria tiene un 
gran efecto en el recuerdo verbal serial, tiene poco o ningún efecto sobre el 
recuerdo visoespacial equivalente (Smyth y Pendleton, 1989). 


Una de las evidencias más robustas acerca de la separación entre la MCP 
fonológica y la visoespacial proviene del estudio de pacientes con trastornos 
neuropsicológicos. Por ejemplo, DeRenzi y Nichelli (1975) identificaron dos 
grupos de pacientes diferentes, uno con la amplitud de dígitos preservada pero 
con un rendimiento deteriorado en amplitud espacial, medida a través de la tarea 
de golpeo de bloques de Corsi, en la que el sujeto intenta seguir una secuencia de 
bloques reproducidos por el examinador, aumentando el número de bloques 
hasta que comete un error. El otro grupo de pacientes muestra el patrón opuesto, 
la amplitud de dígitos está deteriorada pero la amplitud de Corsi está preservada. 
Esta disociación doble se explica fácilmente si se asume que los sistemas 
visoespacial y verbal están separados. Un análisis más detallado de los distintos 
patrones mostrados por cada paciente se puede encontrar en Hanley et al. (1991), 
que muestran a un paciente con amplitud verbal preservada, pero con la 
visoespacial deteriorada, mientras que Basso et al. (1982) muestran el estudio de 
un paciente con el patrón opuesto (ver Della Sala y Logie [2002] y Vallar y 
Papagno [2002] para un estudio detallado de estos pacientes). No solo está claro 
que la MCP visoespacial y la verbal son distintas, sino que, como veremos más 
adelante, dentro del dominio visoespacial existen claras evidencias de la 
disociación. 


El concepto AVE propuesto para dar cuenta del patrón de datos (Baddeley, 1986; 
Baddeley y Hitch, 1974) asume que la agenda se emplea como un sistema de 
almacenamiento capaz de integrar la información visual y espacial, ya sean 
adquiridas visualmente, con el tacto, con el lenguaje o con la MLP, en una única 
representación visoespacial. Hay que destacar que la agenda por sí misma no es 
específica de la modalidad, aunque la cuestión de si la información visual y la 
verbal también se pudieran almacenar por separado ha quedado inicialmente sin 


determinar. Se asumió que existía algún tipo de repaso, pero su naturaleza no 
estaba clara, considerando los movimientos oculares implícitos como una 
posibilidad, aunque sin llegar a recibir un apoyo inequívoco (Baddeley, 1986). 


¿Qué ha cambiado? Como en el caso del bucle fonológico, la principal debilidad 
del concepto de AVE recae no tanto en lo que va mal, sino en lo que permanece 
sin especificar. Aunque el progreso en esta área no ha sido rápido, hay signos de 
que esto está empezando a cambiar, con pruebas cada vez mayores que proceden 
de investigaciones tradicionales previamente independientes que convergen 
hacia el estudio de la interfaz entre atención, percepción y memoria. Comenzaré 
discutiendo la MCP visoespacial, y dejaré para el próximo capítulo el papel de la 
AVE en las imágenes visuales. 


4.2. Fraccionando la memoria de trabajo visoespacial 


Nuestro mundo visual comprende objetos que pueden estar presentes en lugares 
específicos. Los objetos se pueden mover de lugar a lo largo del tiempo, o nos 
podemos encontrar una secuencia de objetos diferentes que aparecen 
secuencialmente en un mismo lugar. Los estudios sobre memoria de trabajo 
visoespacial han utilizado un amplio rango de métodos que típicamente 
combinan dos o más de estas variables. Un objeto ha de presentarse en un lugar, 
incluso si no es una característica crítica del test, y típicamente están compuestos 
por un determinado patrón espacial de rasgos. Más aún, los procedimientos 
experimentales de memoria visual típicamente incluyen un estímulo seguido de 
un test visual, que requiere al menos un almacenamiento secuencial mínimo en 
la memoria. Como veremos, cada vez está más claro que la memoria de objetos, 
la localización espacial y la secuencia temporal posiblemente incluyan diferentes 
procesos de memoria, que por supuesto pueden interactuar entre sí y con otros 
componentes de la memoria de trabajo y la memoria a largo plazo. A pesar de su 
complejidad, creo que estamos consiguiendo buenos progresos. Intentaré 
demostrarlo explicando primero la MCP visoespacial, de objetos y secuencial 
por separado, antes de discutir el complejo tema que supone la separación de 
estos componentes de la AVE. 


4.3. Memoria para la localización espacial 


Imagina que una mañana estás en una habitación y de pronto se funden los 
plomos dejando la habitación a oscuras. ¿Qué tal recordarías dónde estaba la 
puerta, o quizá dónde podría estar la caja de los plomos? A lo largo de los años 
han existido una serie de estudios acerca de estos aspectos, cuyas evidencias 
sugerían que la capacidad para mover todo el cuerpo en la dirección apropiada 
permanece con modesta precisión no más de 30 segundos después de que se 
apaguen las luces (Steenhuis y Goodale, 1988; Thomson, 1983), mientras que la 
capacidad de tocar algo de forma precisa parece desaparecer algo más rápido 
(Elliot y Madalena, 1987). Parece que registramos de forma relativamente 
automática el lugar en que se encuentran una serie de objetos (Andrade y 
Meudell, 1993; Hasher y Zacks, 1979), aunque prestar atención a la escena 
incrementa la precisión (Naveh-Benjamin, 1987; 1988). La capacidad para 
recordar los lugares en los que han aparecido una serie de objetos parece ser casi 
la misma en niños que en adultos, aunque la capacidad para asociar un objeto 
particular con el lugar concreto que ocupa muestra una clara tendencia evolutiva 
(Schumann-Hengsteler, 1992; Walter et al. , 1994). Por tanto, parece que esta 
tarea tiene dos componentes, recordar dónde y recordar qué, que están influidos 
de manera diferente por el desarrollo cognitivo. Empezaremos considerando la 
memoria para localizar un lugar, comenzando con el caso más simple, el de 
recordar un único emplazamiento, considerando por un lado la memoria para el 
input visual y por otro lado la memoria para el input cinético. 


Posner y Konick (1966) pidieron a sus sujetos que recordaran la posición de un 
punto a lo largo de una línea recta, después les pedían el recuerdo tras un breve 
intervalo de tiempo sin rellenar o bien rellenado con una serie de tareas de 
procesamiento de dígitos que variaban en cuanto a la demanda cognitiva. No 
encontraron olvido durante la demora sin relleno, pero en la demora rellenada, la 
cantidad de olvido aumentó con la demanda de la tarea interviniente. Posner y 
Konick (1966) interpretaron sus resultados sugiriendo la posibilidad de que 
tuviera lugar alguna forma de repaso, pero que esta fuera interrumpida por la 
tarea cognitiva concurrente. El hecho de que el olvido aumentara con la 
demanda atencional de estas tareas sugiere que el proceso no es un simple 
proceso de repaso subvocal, ya que, de ser así, todas las tareas verbales hubieran 
impedido la articulación. El mismo patrón aparece también en la versión verbal 
estándar de la tarea del olvido a corto plazo de Peterson, en la que una tarea que 


requiere demanda atencional da lugar al olvido, mientras que la supresión 
articulatoria no (Baddeley et al. , 1984a). 


Dale (1973) puso a prueba el recuerdo de la posición de un punto que aparecía 
brevemente cada vez en un lugar distinto, dentro de un cuadrado abierto con una 
medida de un pie por un pie* y observó un claro olvido cuando la demora se 
rellenaba con una tarea de procesamiento de dígitos. Warrington y Baddeley 
(1974) mostraron que pacientes amnésicos con una MLP ampliamente 
deteriorada eran capaces de realizar esta tarea de MCP visual con normalidad, 
pero sufrían un deterioro con la versión a largo plazo en la que se les pedía que 
aprendieran y retuvieran un patrón compuesto por una serie de puntos. 


Los estudios descritos anteriormente estaban basados en el paradigma de olvido 
a corto plazo de Peterson y Peterson, que sugiere la posibilidad de que el olvido 
observado esté basado principalmente en una interferencia proactiva, que a su 
vez refleja la capacidad del sujeto para discriminar la huella de memoria del ítem 
prueba de la del resto de los ítems anteriores. En el caso de la memoria verbal, el 
recuerdo durante el primer ensayo es excelente pero decae rápidamente en los 
ensayos posteriores, a menos que se interponga una demora entre ensayos 
(Keppel y Underwood, 1962; Loess y Waugh, 1967). Sin embargo, Warrington y 
Baddeley (1974) no encontraron evidencias del incremento de la IP, en contraste 
con los resultados hallados para el olvido verbal a corto plazo, donde tanto los 
amnésicos como los sujetos control mostraron el típico rápido incremento de la 
IP a lo largo de los sucesivos ensayos experimentales (Baddeley y Warrington, 
1970). 


Cuando el campo abierto en el que aparecen los estímulos contiene puntos de 
referencia, como un círculo o un cuadrado dibujados, los sujetos tienden a 
utilizarlos (Nelson y Chaiklin, 1980). En un estudio posterior, Igel y Harvey 
(1991) variaron el número de puntos de uno a diez, presentándoselos simultánea 
o secuencialmente, con y sin marco cuadrado. Los tres factores influyeron en el 
rendimiento, el aumento de los puntos lo deterioraba, fue mejor con la 
presentación simultánea que con la secuencial y mejoró con la presencia de 
puntos de referencia. Huttenlocher et al. (1991) sugieren dos tipos de 
codificación para las posiciones, uno que es más tosco y categorial —como, por 
ejemplo, el cuadrante que ocupa el estímulo— y otro más fino que parece usar 
algo análogo a las coordenadas polares. 


Para resumir: la MCP para la localización visual muestra una leve pérdida a lo 


largo de breves intervalos sin tareas de relleno, bien porque el estímulo se repasa 
o bien porque el olvido solo se da cuando hay interferencia al presentar 
estímulos interpolados. La interpretación del repaso se ve apoyada por el hecho 
de que aparentemente en las tareas no visuales, como el procesamiento de 
dígitos, se incrementa el olvido, siendo mayor cuanto mayor es la dificultad de la 
tarea interviniente. A diferencia de la MCP verbal, la escasa evidencia disponible 
sugiere que la IP no juega un papel importante. 


4.4. Memoria a corto plazo basada en objetos 


Los clásicos trabajos en la psicología cognitiva de la atención visual resaltaban 
el hecho de que nuestro sistema visual recoge información procedente de una 
serie de canales sensoriales distintos, que codifican de manera independiente 
características como la forma, la localización, el tamaño y el color, y por tanto 
suscitan la cuestión acerca de cómo se combinan los diferentes canales para dar 
lugar a un percepción integrada (Treisman, 1993). El sistema visual está 
claramente limitado en cuanto a la información que procesa, pero según Duncan 
(1984) es capaz de combinar y codificar dos características como la orientación 
y la textura tan rápido como si fueran una sola característica, siempre que las dos 
estén presentes en un mismo objeto. Egly et al. (1994) se propusieron demostrar 
que al atender a un componente de un objeto, como un rectángulo, la atención se 
expande a todo el objeto de manera automática. 


Irwin y Andrews (1996) demostraron un fenómeno similar para la memoria 
inmediata. Sus sujetos veían un vector de seis letras, todas de diferentes colores, 
después de lo cual se les pedía que desplazaran sus ojos a un objeto en la 
periferia. En ese momento las letras desaparecían, siendo reemplazas por un 
asterisco que ocupaba el lugar de una de las letras. La tarea del sujeto era decir 
esa letra, el color o las dos cosas. Se estudió el rendimiento con distintas 
amplitudes que iban de una a doce letras. Los sujetos fueron capaces de recordar 
de tres a cuatro letras, y su rendimiento fue igual de bueno cuando se les pedía 
tanto la letra como el color que cuando solo se les pedía una sola característica. 


Aunque aparentemente esto puede sugerir que la MCP visual está limitada en 
cuanto al número de objetos, no en cuanto a los rasgos, también es posible, por 


supuesto, que los sujetos utilizaran una codificación verbal para el nombre de las 
letras, como sugieren Walter y Cuthbert (1998). Luck y Vogel evitaron este 
problema (1997) utilizando como estímulo unas barras presentadas con 
diferentes orientaciones, de manera que no fuera una característica fácil de 
codificar verbalmente. Combinaron la orientación de las barras con una y hasta 
cuatro rasgos del estímulo distintas, como el color y la textura. De nuevo 
encontraron que los sujetos eran capaces de recordar cerca de cuatro objetos, 
independientemente de que esto implicara almacenar una, dos o cuatro rasgos. 


En un estudio posterior, Vogel et al. (2001) exploraron cuidadosamente una serie 
de posibles explicaciones alternativas a estos resultados. Desecharon la 
interpretación de la codificación verbal presentando los ítems rápidamente, 
dejando así poco tiempo para poder nombrarlos, en combinación con el uso de 
formas que no eran fácilmente nombrables. Ninguna de estas manipulaciones 
dificultó el rendimiento. En otro estudio se pidió a los sujetos que mantuvieran 
una carga verbal continua de dos dígitos. Esto fue suficiente para interrumpir 
otra tarea verbal equivalente basada en letras, pero no influyó en la tarea de 
memoria visual. 


Otro experimento amplió sus investigaciones acerca del número de rasgos que se 
pueden mantener, mostrando que los sujetos son capaces de recordar hasta 16 
rasgos, siempre que se repartan entre cuatro objetos. Un último estudio se ocupó 
del efecto de la demora sobre el rendimiento, examinando el vector de objetos 
después de un intervalo de demora de 900, 2.900 o 4.900 milisegundos. 
Encontraron el efecto estándar en cuanto al número de objetos, con una 
disminución de la precisión a medida que aumentaba el tamaño del conjunto de 
objetos desde cuatro, hasta ocho y hasta doce. Sin embargo, no encontraron 
efecto de la demora ni de interacción entre la demora y el número de objetos. En 
resumen, no encontraron evidencias del olvido, un punto al que volveremos más 
tarde. 


Discutiendo sus resultados, Vogel et al. apuntan a una capacidad semejante de 
tres a cuatro ítems en el estudio de Sperling con letras presentadas visualmente 
(Sperling, 1960), observando también que la amplitud para dígitos presentados 
visualmente ronda también estos niveles cuando la codificación fonológica se 
interrumpe por la supresión articulatoria (Baddeley et al. , 1984a). Finalmente, 
es de destacar que Cowan (2001; 2005), en una amplia revisión de la literatura 
existente acerca de las diversas modalidades y paradigmas, argumenta 
claramente a favor de una capacidad para la memoria de trabajo de unos cuatros 


segmentos ( Chunks), tal como observaron Vogel et al. 


4.4.1. Un modelo para la memoria de trabajo visual 


Vogel et al. (2001) propusieron un modelo que se apoya en teorías basadas en 
técnicas neurofisiológicas y que trata de la combinación de rasgos en la atención 
visual. Sugieren que la codificación de un objeto visual conlleva un aumento de 
la actividad de aquellas neuronas que codifican los rasgos de los objetos, una 
idea que es consistente tanto con los estudios en los que se registra una sola 
unidad (Fuster y Jervey, 1981; Miller et al. , 1996) como con las evidencias en 
neuroimagen (Cohen, Perlstein et al. , 1997). Surge así la cuestión sobre cómo se 
codifican dos objetos que tienen diferentes valores en un mismo rasgo, por 
ejemplo, una barra roja vertical y una barra verde horizontal. Este problema se 
podría resolver posiblemente si se codificara también la situación de los dos 
objetos. Sin embargo, sabemos que la memoria de reconocimiento de patrones 
no depende de que el patrón de reconocimiento aparezca justo en el mismo lugar 
que el estímulo original (Phillips, 1974), lo que sugiere que la localización no es 
la pista crucial que permite la diferenciación. 


Una solución alternativa al problema de la combinación de rasgos es el empleo 
de una activación sincronizada; los rasgos relevantes de cada objeto, incluyendo 
la localización, se activan en sincronía, dando lugar a una integración de los 
rasgos que se activan juntos. Si fuera el caso de este modelo, el límite estaría 
fijado probablemente no por el número de rasgos, sino por el riesgo de una 
sincronización accidental a medida que el número de objetos se incrementara. 
Por supuesto, la idea de vincular rasgos mediante una activación sincronizada no 
es nueva, y ha recibido un apoyo razonable tanto a nivel neurofisiológico como 
computacional (e.g., Singer y Gray, 1995; von der Malsburg, 1995). Finalmente, 
Raffone y Wolters (2001) han propuesto un modelo computacional detallado que 
da cuenta de forma más apropiada de los resultados descritos por Luck y Vogel 
(1997) y Vogel et al. (2001). 


4,4.2. Limitaciones del modelo de Vogel et al. 


Llegados a este punto, ¿cuáles son los defectos del modelo? Como Vogel et al. 
apuntan, parece poco plausible asumir que nuestra memoria pueda en un 
momento dado contener solo cuatro objetos, dada la aparente riqueza de nuestro 
mundo visual experimentado subjetivamente. Ellos argumentan que esto no es 
un reflejo de la estabilidad de nuestras memorias, sino del mundo mismo, 
mencionando como prueba el fenómeno de la ceguera al cambio. El paradigma 
de la ceguera al cambio consiste en ver una escena compleja, seguida de un 
breve intervalo en blanco después del cual se vuelve a mostrar la escena pero 
con un detalle crítico cambiado. Los sujetos son notablemente malos para 
detectar estos cambios, tanto en el laboratorio como en el mundo real donde se 
han dado algunos casos muy dramáticos. Por ejemplo, se detiene a un sujeto por 
la calle y se le hace una pregunta. Antes de que él o ella pueda contestar, dos 
personas pasan entre ellos dos cargando con un objeto que haga de pantalla, 
como por ejemplo una puerta. Durante este corto espacio de tiempo el sujeto que 
hacía la pregunta es sustituido por otra persona. El sujeto raramente se percata 
(Rensink, 2000). Rensink et al. (1997) sugieren que nuestra selección perceptiva 
del entorno es guiada a través de la MLP que se centra en ciertos puntos de 
actual importancia e ignora otras características, un enfoque apoyado por Wagar 
y Dixon (2005). Usando una tarea de categorización, encontraron que aquellos 
rasgos más diagnósticos eran menos susceptibles a la ceguera al cambio. 


Mientras que ciertamente el fenómeno de la ceguera al cambio demuestra que la 
memoria de trabajo visual es altamente selectiva, y que confiamos en la 
continuidad del mundo, el hecho de que el mundo parezca continuo implica que 
en algún lugar estamos almacenando esa información, aunque sea transformada 
y reducida. El hecho de que podamos recordar una secuencia de movimientos, 
como en la tarea del golpeo de bloques de Corsi, estaría demandando un 
mecanismo que iría más allá del recuerdo de cuatro objetos. Finalmente, el 
hecho de que podamos crear una imagen visoespacial basada en un input 
auditivo (Baddeley y Lieberman, 1980; Brooks, 1967; 1968) sugiere que, aunque 
el nexo de unión entre la memoria de trabajo visual y la atención visual sea 
importante, solo es parte de un complejo sistema de almacenamiento 
visoespacial y de un sistema de manipulación. 


4.4.3. El papel de la atención en la memoria de trabajo visual 


Una característica atractiva del modelo de Vogel et al. es que proporciona una 
unión entre la memoria visual y los típicos temas de la atención visual, como la 
percepción de objetos (Duncan, 1984), la investigación visual (Duncan y 
Humphreys, 1989) y el clásico problema de la combinación (Singer y Gray, 
1995). Otros estudios han apoyado aún más esta unión, lo que ha dado lugar a 
una serie de principios generales. Entre ellos se incluyen: 


1. Los factores atencionales pueden influir en la codificación de la memoria de 
trabajo: Schmidt et al. (2002) presentaron a los sujetos una serie de seis 
cuadrados coloreados, uno de los cuales se acompañó por un indicio indicando 
que a continuación se pediría el recuerdo. La atención se desplaza 
automáticamente hacia el cambio ocurrido dentro del campo de visión. Incluso 
cuando no hay relación entre el lugar del cambio y el ítem a examinar, el 
cuadrado asociado al indicio que informa del cambio, se recuerda mejor si se 
examina posteriormente. En un segundo estudio de Woodman et al. (2003) se 
empleó la detección del cambio tras una breve demora como medida de los ítems 
que se habían codificado. Encontraron que aquellos ítems unidos por principios 
gestálticos, como la continuidad, era más probable que fueran atendidos y 
codificados, con el resultado de que los cambios en esos patrones se detectaban 
más fácilmente que los cambios en los ítems sin relación gestáltica. 


2. Mantener un ítem en la memoria de trabajo puede sesgar la atención: 
Downing (2000) presentó a los sujetos una sola cara que debían recordar. 
Después aparecían dos caras, la vieja y una nueva, y a continuación se les pedía 
que juzgaran el lugar de un espacio en un paréntesis. Cuando el paréntesis 
aparecía en el mismo lugar que la cara vieja, almacenada en la memoria de 
trabajo, los juicios eran más rápidos y precisos que cuando aparecía en el lugar 
que había ocupado la cara nueva. Esto es particularmente chocante ya que existe 
una tendencia natural de los movimientos de los ojos a desplazarse hacia los 
estímulos nuevos. Por tanto, mantener un ítem en la memoria de trabajo parece 
determinar la localización atencional de manera lo suficientemente poderosa 
como para prevalecer sobre esta tendencia. 


3. Las tareas atencionalmente demandantes no interrumpen necesariamente la 
memoria de trabajo visual: Esto se ve apoyado por el descubrimiento de Vogel et 


al. (2001) de que rellenar una demora con una tarea atencionalmente demandante 
no incrementa el olvido. Cocchini et al. (2002) estudiaron el recuerdo de un 
patrón matricial aleatorio a través de una demora sin relleno, o bien ocupada por 
el recuerdo de una secuencia de dígitos con cierta amplitud de la longitud. No 
encontraron diferencias significativas entre las dos condiciones. Esto no quiere 
decir que una actividad no visual durante el intervalo de retención no deteriore 
nunca el recuerdo. Morey y Cowan (2005) encontraron, por ejemplo, que la 
necesidad de retener y articular en voz alta una secuencia de dígitos puede 
deteriorar el recuerdo visual, atribuyendo el efecto a la competición entre los 
procesos de recuperación atencionalmente basados para mantener información 
visoespacial y el recuerdo verbal en voz alta. 


En general, los intentos de unir la investigación en atención visual con el estudio 
de la memoria de trabajo parecen haber tenido éxito al sugerir: (1) Que la 
capacidad del sistema se refleja en el número de objetos, más que en los rasgos. 
(2) Que, efectivamente, el sistema interactúa con la atención de manera 
coherente. (3) Existe una sorprendente ausencia de olvido a lo largo de breves 
demoras, junto con claras evidencias de efectos de interferencia en la respuesta. 
Esto sugiere una serie de cuestiones nuevas que prometen arrojar algo más de 
luz sobre los mecanismos subyacentes. Finalmente, (4) el modelo propuesto por 
Vogel et al. (2001) se asocia perfectamente con las teorías existentes acerca de la 
atención y con posibles soluciones al problema de la combinación en la 
percepción y la conciencia, lo que proporciona de nuevo una grata unión entre 
memoria de trabajo y atención. 


4.4.4, Búsqueda visual y MCP 


La ausencia de signos de olvido en muchos de estos estudios puede parecer algo 
sorprendente dadas las abundantes pruebas en la literatura acerca del olvido 
visoespacial a corto plazo a lo largo de demoras rellenadas (Dale, 1973; Phillips, 
1974; Phillips y Baddeley, 1971; Phillips y Christie, 1977a, b). Sin embargo, una 
posible solución a este problema, según sugieren una serie de estudios recientes, 
tiene que ver con la interacción entre la búsqueda visual y la MCP visual y 


espacial. 


Woodman et al. (2001) pidieron a sus sujetos que recordaran los rasgos visuales 
de unos objetos mientras que ejecutaban una tarea de búsqueda espacial. No 
encontraron un deterioro en el recuerdo, ni en la tarea de búsqueda espacial. Sin 
embargo, cuando Woodman y Luck (2004) combinaron una tarea de memoria 
espacial con una de búsqueda visual, encontraron un incremento de la pendiente 
y del intercepto en la tarea del escaneado. Oh y Kim (2004) encontraron un 
resultado parecido: recordar el color de cuatro cuadrados no tenía efecto en la 
búsqueda visual, mientras que pedirles que recordaran su localización sí influyó 
en la pendiente y en el intercepto de la tarea del escaneado. Parece, por tanto, 
que la memoria espacial se ve interrumpida por la búsqueda visual, no así la 
memoria visual o de objetos. ¿A qué puede deberse esto? 


4.4.5. El papel de los movimientos oculares 


Buscar un determinado ítem a lo largo de una serie visual normalmente 
implicará mover los ojos, un proceso que ha demostrado interrumpir el 
rendimiento en la tarea de imágenes visuales de Brooks (1967) en un estudio de 
Christopher Idzikowski y mío, que se detalla brevemente en Baddeley (1986), y 
que finalmente se publicó junto con otro estudio unos 20 años más tarde (Postle 
et al. , 2006). La tarea, que será descrita con más detalle en el próximo capítulo, 
era algo compleja; sin embargo, estudios posteriores han mostrado efectos 
disruptivos de los movimientos oculares similares en tareas más simples. Hale et 
al. (1996) estudiaron la MCP de letras y su posición dentro de una matriz. 
Encontraron una interrupción significativa en la MCP espacial cuando se 
requerían movimientos oculares, o bien se pedía apuntar la respuesta; sin 
embargo, decir la respuesta dificultaba la memoria de letras, lo que 
presumiblemente reflejaba la implicación del bucle fonológico. 


Sin embargo, es probable que los movimientos oculares estén asociados al 
movimiento del foco atencional. En una ampliación de los estudios publicados 
posteriormente en Postle et al. (2006), Idzikowski y yo llevamos a cabo un 
estudio con el propósito de separar estos efectos, y para nuestra sorpresa, 
encontramos que los movimientos oculares eran más disruptivos que los 


movimientos atencionales. Sin embargo, debido a las dificultades que tuvimos 
con los revisores respecto a nuestra tecnología de movimientos oculares un tanto 
básica, en nuestro intento de publicar el artículo que luego se convirtió en el 
Postle et al. (2006), archivamos este resultado para posibles investigaciones 
futuras. Un estudio como este fue realizado por Pearson y Sahraie (2003), y 
encontraron que los cambios de atención que implicaban movimientos oculares 
interrumpían la MCP espacial significativamente más que los cambios 
atencionales sin movimientos oculares, un resultado que atribuían al papel de la 
actividad oculomotora en el repaso visoespacial. Lawrence et al. (2004) 
combinaron tareas de MCP espaciales y verbales con movimientos oculares 
interpolados. En una condición, la atención y los ojos enfocaban al centro. Una 
segunda condición consistía en el traslado de la atención con los ojos fijos; la 
tercera requería focalizar la atención con los ojos en movimiento, y la cuarta, el 
movimiento de los dos. Los dos tipos de movimientos interpolados deterioraron 
la MCP espacial, siendo mayor el efecto de los movimientos oculares. 


Parece, por tanto, que los movimientos oculares pueden interrumpir la MCP 
espacial, proporcionando una posible explicación al patrón de resultados que 
vinculaban la MCP espacial con la búsqueda visual. Estos resultados también 
son consistentes con la hipótesis propuesta por Hebb (1968) y reestablecida por 
Baddeley (1986), según la cual, el repaso visoespacial puede estar basado en 
procesos de control de los movimientos oculares implícitos. En este punto es 
importante anotar que otras muchas actividades espaciales también parecen 
interrumpir la memoria visoespacial, entre ellas señalar (Brooks, 1968), mover el 
brazo (Lawrence et al. , 2001; Quinn y Ralston, 1986) y el golpeteo espacial 
(Della Sala et al. , 1999). Es poco probable que todas sean atribuibles a los 
movimientos oculares, sugiriendo más bien que los movimientos oculares 
simplemente son una de las formas en las que el movimiento activo concurrente 
interrumpe a la memoria espacial. 


¿Por qué es tan disruptiva la actividad espacial y no la visual? Una posibilidad es 
que la memoria espacial depende del mantenimiento de las coordenadas 
espaciales a lo largo del tiempo, usando posiblemente un foco atencional para 
contrarrestar la tendencia a dispersarse. Otras actividades espaciales que también 
interfieren cuando son interpoladas, como los movimientos oculares y los 
movimientos voluntarios de las manos, probablemente tengan sus propias 
coordenadas espaciales que han de mantenerse para poder responder 
correctamente. Puede que lo que interfiere en la memoria espacial sea el 
conflicto que se produce entre las coordenadas de la tarea de memoria y las 


coordenadas de la actividad que se interpola. Otras características de las tareas 
interpoladas disruptivas, ya estén basadas en movimientos oculares, en 
movimientos de los brazos o bien en el golpeteo manual es que implican una 
ejecución activa de secuencias de respuestas. Antes de seguir discutiendo acerca 
de la interferencia deberíamos considerar un tema más básico, la capacidad de la 
AV para retener información secuencial. 


4.5. Almacenamiento secuencial en la memoria a corto plazo visoespacial 


Una de las primeras medidas de MCP visual, desarrollada por Corsi y 
popularizada por Milner (1971), es análoga a la medida de amplitud de dígitos 
pero en términos visoespaciales. Incluye una serie de nueve bloques cuasi- 
aleatorios; el examinador comienza golpeando dos bloques y pidiendo al 
paciente que lo imite, incrementando gradualmente la longitud de la secuencia 
hasta que el rendimiento decae, lo que ocurre típicamente con longitudes 
alrededor de los cinco bloques o de dos ítems menos que la amplitud de dígitos. 
La evidencia neuropsicológica apunta a una clara distinción entre la amplitud de 
la tarea de Corsi y la amplitud de dígitos, y también indican una clásica 
disociación doble, ya que algunos pacientes muestran deterioro en la amplitud de 
dígitos, pero una amplitud de Corsi normal, mientras que otros muestran el 
patrón contrario (De Renzi y Nichelli, 1975; Hanley et al. , 1991; Vallar y 
Baddeley, 1982). Consistente con este patrón es el hecho de que la supresión 
articulatoria interrumpe la amplitud verbal, pero no tiene efecto sobre la 
amplitud de Corsi (Smyth y Pendleton, 1989). 


La disociación con la amplitud verbal es claramente relevante, pero deja sin 
determinar la naturaleza de los procesos de memoria visoespaciales que 
subyacen a la amplitud de Corsi. Realizar la secuencia de golpes incluye 
claramente coordenadas espaciales, pero es igualmente posible suponer que la 
secuencia se almacena como un patrón general de acciones, haciendo que el 
recuerdo sea quizá más visual que espacial. El desarrollo de una segunda tarea 
de amplitud visual que no requiere el recuerdo de información secuencial ha 
conseguido arrojar algo más de luz sobre este tema. 


El desarrollo del paradigma fue promovido gracias a uno de los primeros 


estudios en memoria visual (Posner y Keele, 1967). Este estudio intentaba usar 
medidas de TR* para diferenciar el almacenamiento de la representación 
fonológica de una letra, del almacenamiento de su código visual (Posner y 
Keele, 1967), concluyendo que el código visual sobrevivía cerca de 1,5 seg.; 
Phillips y Baddeley (1971) no estaban de acuerdo con esta conclusión, ya que el 
método confunde la proporción de pérdida del código visual con la proporción 
de desarrollo del código verbal alternativo. Sugirieron que una mejor 
aproximación sería utilizar material que no fuera fácilmente verbalizable, 
permitiendo así una medida de MCP visual más pura. Phillips y Baddeley 
desarrollaron un conjunto de estímulos basados en una matriz de 5 por 5 celdas, 
la mitad de las cuales se rellenaban al azar, seguido de una máscara empleada 
para obstaculizar la memoria icónica (Sperling, 1960b). Después de una demora 
sin relleno que oscilaba entre los 0,3 y los 9 seg., se presentaba una matriz 
prueba que era idéntica o bien con cambios en alguna celda. Entonces, los 
sujetos tenían que juzgar la semejanza o diferencia entre las dos. El rendimiento 
se nivelaba alrededor de los 9 seg., tanto si se empleaba como medida el TR 
como si se empleaba la exactitud, en contraste con la tasa de demora de 1,5 seg. 
que sugería el experimento de Posner y Keele. Phillips (1974) siguió 
demostrando que el rendimiento dependía de la complejidad del patrón, que 
venía determinada por el tamaño de la matriz. Incrementando el tamaño de la 
matriz de forma gradual, se puede establecer la «amplitud del patrón» visual 
para un individuo concreto, es decir, el punto en el que comienza a descender el 
rendimiento casi perfecto. 


Della Sala et al. (1999) describen el desarrollo y la validación de una medida de 
amplitud de patrones basada en el recuerdo más que en el reconocimiento. Esta 
medida consiste en ver una matriz en la que la mitad de las celdas se rellenan al 
azar. Después se le da al sujeto una matriz vacía, y se le pide que marque las 
celdas que previamente estaban rellenas. La prueba comienza con una matriz 
simple de dos por dos, y se va incrementando el tamaño gradualmente hasta que 
el rendimiento desciende, lo que típicamente sucede con unas 16 celdas 
aproximadamente. Della Sala et al. sugieren que la amplitud del patrón es 
independiente de la amplitud de secuencias de Corsi, y describen un estudio de 
Grossi et al. (1993) en el que se identificaron dos pacientes con la enfermedad de 
Alzheimer, uno mostraba un rendimiento muy bajo en la amplitud de Corsi pero 
conservaba la amplitud del patrón, y el otro mostraba lo opuesto. Della Sala et 
al. describen a dos pacientes con deterioro en la tarea de Corsi, pero con una 
amplitud del patrón por encima de la media, junto con otro paciente que muestra 
lo contrario. También describen un estudio con pacientes normales, indicando 


que la amplitud del patrón se ve interrumpida en mayor medida por la 
presentación de estímulos visuales irrelevantes que por el tamborileo espacial, 
mientras que la tarea de Corsi muestra el patrón opuesto, se ve interrumpida por 
el procesamiento espacial posterior más que por el procesamiento visual. Esta 
disociación doble sugiere que la amplitud de Corsi no se codifica simplemente 
como un patrón espacial, y que su carácter secuencial es importante. 


¿Se pueden almacenar secuencias de patrones? La respuesta inicial parece ser 
negativa. Una serie de experimentos de Phillips y Christie (1977a, b) 
examinaron el reconocimiento de secuencias de patrones de matrices del tipo 
descrito anteriormente. Encontraron un rendimiento excelente para el último 
ítem, pero solo cuando se examinaba en primer lugar. Cuando se examinaba en 
segundo lugar, mostraba el mismo nivel de reconocimiento bajo que los ítems 
previos, independientemente del orden en que se examinaran. El rendimiento del 
último ítem no se veía afectado por estímulos visuales posteriores, pero sí por 
una tarea de mayor demanda ejecutiva. Este resultado repercutió en mi propio 
concepto de la AVE como un sistema de almacenamiento paralelo, no preparado 
para retener secuencias de ítems. Como veremos, puede que no ocurra lo mismo 
con estímulos visuales menos complejos. 


Una serie de estudios han explorado este tema, estudiando el recuerdo de 
estímulos algo más simples presentados secuencialmente en una misma 
localización espacial. Mientras que el recuerdo en orden serial tiende a aumentar 
la confianza en la codificación verbal, una buena fuente de evidencias apunta a 
la capacidad para recordar el orden serial de ítems presentados visualmente que 
no son fácilmente verbalizables, que van desde patrones con papel de pared 
(Broadbent y Broadbent, 1981), a ideogramas chinos desconocidos (Wolford y 
Hollingsworth, 1981) y caras (Smyth et al. , 2005). Logie et al. (2000) revisaron 
estos estudios, observando que a menudo las pruebas son algo erróneas debido a 
la dificultad que supone tener la completa certeza de que se puede eliminar 
cualquier forma de codificación verbal. Logie y Marchetti (1991) intentaron 
solucionar este problema usando estímulos cuya pronunciación no resultara de 
mucha ayuda. Presentaron a los sujetos un vector de cuadrados, todos con el 
mismo color, por ejemplo, rojo, pero que se diferenciaban en la forma. Cuando 
la presentación era rápida, y los colores básicos empleados cambiaban de ensayo 
a ensayo, la codificación verbal era extremadamente difícil. Como medida de 
recuerdo se empleó el reconocimiento; para ello, después de cada secuencia se 
mostraba una secuencia de reconocimiento idéntica salvo por un único cambio, o 
bien en la forma o bien en el orden de presentación. El reconocimiento se pedía 


después de diez segundos de demora sin rellenar o bien rellenada con 
movimientos ocultos de los brazos o con dibujos irrelevantes. Los movimientos 
de los brazos interrumpían el recuerdo de la información secuencial, mientras 
que los dibujos dificultaban el recuerdo acerca del color, lo que sugería una 
distinción entre la memoria para el color y la visual, por un lado, y la memoria 
para el orden serial y la información espacial, por otro, un resultado consistente 
con la disociación descrita previamente entre la amplitud de Corsi y la de 
patrones. 


4.5.1. MCP para secuencias de acciones 


Todas las tareas secuenciales descritas hasta el momento requieren reproducir 
una secuencia arbitraria de estímulos visuales o de localizaciones espaciales. Sin 
embargo, hay otra clase importante de actividades especificadas 
visoespacialmente, para las que el orden serial es a menudo crucial, 
concretamente el rendimiento en secuencias de acciones, como en la adquisición 
de una nueva habilidad motora o en la comunicación por gestos o en la danza. 
Smyth y Pendleton (1989) se preocuparon por la capacidad para recordar las 
secuencias de estas acciones. Compararon la memoria para la localización 
espacial con la capacidad para recordar y repetir una secuencia de gestos 
manuales. Se usaron dos tareas potencialmente incompatibles: una era espacial e 
implicaba una serie de movimientos para especificar lugares, mientras que la 
otra empleaba una tarea más puramente cinética en la que se les pedía a los 
sujetos que apretaran una perilla durante la codificación. Tal como se esperaba, 
la amplitud espacial se deterioraba con el movimiento concurrente, pero no con 
el apretón cinético. Sin embargo, la memoria para los gestos mostró exactamente 
el patrón opuesto, se interrumpía con la tarea cinética, pero no con la tarea 
espacial interpolada (ver Fig. 4.1). Observa que ambas tareas de memoria 
requieren recuerdo en orden serial, lo que sugiere una MCP espacial y cinética 
separables, ambas con capacidad para albergar información secuencial. 
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Fig. 4.1. El impacto del movimiento concurrente y del apretón en el recuerdo de 
secuencias de movimientos o localizaciones espaciales. O = No deterioro. Datos 
de Smyth y Pendleton (1989). 


Smyth et al. (1988) encontraron una disociación similar en un estudio en el que 
se pidió a los sujetos que observaran cómo el experimentador ejecutaba una serie 
de movimientos, como alzar el brazo izquierdo por encima de la cabeza, saltar a 
la pata coja sobre la pierna derecha, inclinar hacia atrás la cabeza, y algunas más, 
y después se les pedía que imitaran la secuencia. Los sujetos alcanzaban una 
amplitud cercana a unos cuatro movimientos de ese tipo (cf. Cowan, 2005). 
También se examinaba a los sujetos en la amplitud espacial de Corsi y en MCP 
verbal. Después, estas tres tareas se combinaban con otras tres actividades que 
podían causar una interferencia potencial, concretamente la supresión 
articulatoria, copiar un patrón espacial repetido y una tarea con movimiento. 
Esta implicaba alzar ambas manos en el aire repetidamente, después hacia los 
hombros y luego a las caderas, repitiendo estas acciones continuamente. Esta 
última tarea interrumpía la memoria de movimientos pero no la amplitud de 
Corsi o la verbal. El tamborileo espacial afectó solo a la tarea de Corsi, mientras 
que la supresión articulatoria no afectó al rendimiento en la tarea de Corsi, pero 
redujo significativamente la amplitud verbal y de movimientos (ver Fig. 4.2). 
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Fig. 4.2. Memoria para secuencias de acciones, lugares o dígitos en función de 
tres tareas concurrentes, incluyendo movimientos, el tamborileo espacial o la 
supresión articulatoria. 0 = No deterioro. Datos procedentes de Smyth et al. 
(1988). 


El patrón de resultados conjunto obtenido en los dos estudios de Smyth et al. 
refuerza la distinción entre la tarea de amplitud espacial de Corsi y la memoria 
para secuencias de gestos, proporcionando más evidencias de un sistema cinético 
separado. Sin embargo, podría argumentarse que estos estudios no incluían una 
tarea de MCP basada en objetos. Parece poco probable que el sistema de objetos 
visuales esté equipado para almacenar secuencias de gestos y acciones, aunque 
debería comprobarse. Un hallazgo sorprendente es que la supresión articulatoria 
interfirió con el recuerdo de secuencias de movimientos, aunque el movimiento 
no interfirió con la amplitud verbal. Esto podría estar sugiriendo que los sujetos 
estaban usando un código verbal para complementar el recuerdo de gestos. 


Claramente, la MCP cinética es de considerable importancia potencial para la 
adquisición y el rendimiento en una amplia serie de habilidades que van desde la 
danza (Smyth et al. , 1988), hasta escalar montañas (Smyth y Waller, 1998) o 
remar (Woodin et al. , 1996). Aunque el estudio de tareas ecológicas relevantes 
es importante, la complejidad de muchas de estas actividades hace que sea muy 
difícil separar el posible papel de la MCP cinética del papel de la memoria 
espacial, visual y verbal. Este es un aspecto importante e interesante de la 
memoria de trabajo que está todavía sin explorar. 


4.5.2. Modelando el orden serial en la memoria a corto plazo visoespacial 


A diferencia del campo verbal, parece que ha habido escasos intentos por 
modelar el recuerdo visoespacial en orden serial, a lo mejor no es sorprendente, 
dada la relativa pobreza y complejidad de los datos disponibles. Existen claras 
similitudes con los efectos de posición serial verbales, incluyendo la clásica 
curvatura de la curva de posición serial (Logie y Marchetti, 1991; Smyth et al. , 


2005) y el efecto de recencia (Phillips y Christie, 1977a, b), aunque en este caso 
la recencia se limitaba a un ítem y no se veía perturbada al interponer una tarea 
no demandante. 


Por tanto, un posible punto de partida útil sería considerar la hipótesis de que los 
modelos desarrollados para la MCP verbal y descritos en el Capítulo 3 también 
pueden aplicarse al área visoespacial. Si este fuera el caso, de ninguna manera 
debería socavar la extensa evidencia acerca de la separación de los sistemas 
verbal, visual y espacial, pero sí sugeriría que el mismo problema, 
concretamente el del almacenamiento en orden serial, ha sido resuelto de forma 
comparable a través de otros sistemas. Esto podría consistir en un simple sistema 
unitario para el mantenimiento del orden serial, aunque parece poco probable, ya 
que el recuerdo verbal serial no interfiere con el recuerdo espacial en la tarea de 
Corsi, y el golpeteo espacial serial no interfiere con el recuerdo de secuencias de 
movimientos corporales. 


4.6. Desmadejando los hilos 


Empezábamos este capítulo afirmando la necesidad de asumir la separación de 
los sistemas visoespacial y verbal. A estas alturas hemos concluido no solo que 
se debe asumir un sistema visoespacial por separado, sino también que el 
almacén visual basado en objetos supone un subsistema distinto al sistema de 
almacenamiento de información relacionada con la localización espacial, que a 
su Vez parece ser distinto del sistema de almacenamiento de movimientos en el 
espacio, posiblemente sobre una base cinética. ¿Pero estas distinciones están 
verdaderamente justificadas? La clásica evidencia sobre la necesidad de asumir 
dos sistemas separados implica una disociación doble cruzada a través de la cual, 
por ejemplo, la Tarea A se ve interrumpida por la Actividad 1 pero no por la 2, 
mientras que la Tarea B muestra lo contrario, el rendimiento se ve interrumpido 
por la 2 pero no por la 1. Sin embargo, mientras que este resultado supondría 
graves problemas en cuanto a su interpretación teórica, no garantiza que los dos 
sistemas estén separados. Este tema lo discuten ampliamente una serie de 
colaboradores del número de febrero 2003 de la revista Cortex (volumen 399, 
pp. 1-202). Entre las posibles objeciones se incluyen: 


1. Procesamientos diferentes, a través de los cuales las dos tareas de memoria 
difieren en más de una dimensión. Por ejemplo, la tarea de Corsi y la de los 
patrones difieren en la dimensión visoespacial, así como en la dimensión 
unitaria-secuencial, dificultando la interpretación. 


2. La diferencia observada puede provenir de cualquier punto de las tareas de 
procesamiento y memoria, reflejando, por ejemplo, la capacidad para percibir o 
registrar dos conjuntos de estímulos, en vez del recuerdo. 


3. La disociación puede proceder de distintos grados de similitud entre las tareas 
de memoria y de procesamiento a través de los dos sistemas, siendo por tanto 
comprensible si, por ejemplo, uno asume un único sistema de MLP 
multidimensional sujeto a los clásicos efectos de interferencia, como en la 
hipótesis del rasgo propuesta por Nairne (1990) y descrita en el Capítulo 3. 


4. Asumiendo ciertos supuestos de no linealidad, es posible generar datos que 
parecen reflejar una disociación doble sobre la base de un único parámetro 
(Kello, 2003). 


5. A lo mejor, la objeción más seria a la hora de poder confiar en la disociación 
doble es la posibilidad de que los dos sistemas no sean equiparables en un tercer 
o cuarto determinante del rendimiento. Esto es particularmente revelador en el 
caso de un sistema como el modelo multicomponente de la memoria de trabajo, 
que asume que se pueden destinar una serie de subsistemas al rendimiento de 
cualquier tarea. Algunos de estos sistemas, como el bucle fonológico, pueden ser 
razonablemente fáciles de excluir, pero otros como el ejecutivo central son más 
complejos y más difíciles de excluir. El problema se vuelve más complicado 
cuando, como en el caso de la agenda, el propio subsistema parece fraccionarse 
en dos o probablemente en tres subcomponentes potencialmente diferentes. En 
teoría, se podrían buscar disociaciones triples o cuádruples. Esto demandaría 9 y 
16 condiciones, respectivamente, todas con peso en cada una de las dimensiones 
excepto en aquellas estudiadas. Lo que no parece ser una buena forma de 
proceder. 


Mi propio punto de vista es que la única forma de lidiar con esta complejidad es 
a través del clásico método de operaciones convergentes. Esto incluye el uso de 


una serie de tareas diferentes pensadas para reflejar los distintos sistemas que 
hipotéticamente subyacen. Estas tareas deberían escogerse de forma que se 
pudieran descartar hipótesis alternativas, y aceptando totalmente que ningún 
experimento será crucial, pero confiando en que un banco de datos lo 
suficientemente rico y coherente aportará grandes restricciones que descartarán 
la mayoría de las hipótesis rivales. Este es el método que hemos usado para 
tratar el bucle fonológico. Como vimos, el resultado no es una «prueba» que yo 
considere como un criterio apropiado para las matemáticas pero no para las 
ciencias, sino como una acumulación gradual de evidencias para conceptualizar 
el mundo. Como muchas de las teorías, se da por supuesto que se ampliará y, 
probablemente en su debido momento, será reemplazada. Mientras tanto, yo 
sugeriría que, tanto el método como el modelo resultante, han demostrado ser 
fructíferos. ¿Pero qué ocurre con la agenda, que desde luego es casi más 
compleja que el bucle fonológico? Sugiero una conclusión, reforzada por la 
disociación entre la MCP visual y espacial, gracias a la serie de experimentos 
asombrosamente minuciosos que llevaron a cabo Klauer y Zhao (2004). 


Klauer y Zhao comienzan discutiendo los potenciales obstáculos descritos 
previamente al interpretar las disociaciones dobles, y continúan analizando 11 
estudios que discuten la disociación entre la MCP visual y espacial, apuntando 
que ninguno de ellos escapa a todas las posibles objeciones. Así pues, continúan 
describiendo una serie de seis experimentos que intentan descartar estas 
interpretaciones alternativas y comienzan desarrollando tareas espaciales y 
visuales simples, basadas en un estudio previo de Tresch et al. (1993). Las tareas 
espaciales de Klauer y Zhao implican recordar el lugar que ocupa un punto 
blanco sobre un fondo negro, mientras que las visuales implican recordar 
ideogramas chinos. Se muestra un ideograma y, tras un intervalo de 10 segundos 
de demora, se le muestra un conjunto de 8 ítems y se pide al sujeto que escoja el 
ítem presentado anteriormente. Durante el intervalo de demora de 10 segundos, 
los sujetos ejecutan una tarea espacial en la que se presentan 12 asteriscos, once 
de los cuales se mueven al azar y uno se queda quieto. La tarea del sujeto 
consistía en identificar el que se queda quieto. Por otro lado, la tarea escogida 
para interferir en la memoria visual implicaba discriminar colores. Durante el 
intervalo de demora, la pantalla se inundaba con una serie de colores 
monocromáticos, siete de los cuales serían categorizados como pertenecientes a 
la «familia de los rojos» y los otros siete a la «familia de los azules». Por tanto, 
el paradigma básico implica estímulos espaciales o visuales seguidos de tareas 
sobre juicios acerca del color o el movimiento, formándose así cuatro 
condiciones de interferencia, junto con dos condiciones control tomadas como 


línea base, en las que las dos tareas de memoria se ejecutan en solitario. Se 
predijo que la tarea del juicio acerca del movimiento interferiría en la tarea 
espacial de recuerdo de los puntos, mientras que la tarea del juicio acerca del 
color interferiría en la tarea visual de reconocimiento de los ideogramas. 
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Fig. 4.3. Memoria para la localización de un punto y memoria para los 
ideogramas en función de la tarea presentada durante el intervalo de demora de 
diez segundos. El panel superior representa el rendimiento en memoria; el panel 

del medio, el grado de interferencia, y el panel de abajo, el rendimiento en las 
tareas secundarias. Ver el texto para más detalles. Datos procedentes de Klauer y 
Zhao (2004), Figura 2. 


Los resultados de este paradigma básico se muestran en la Figura 4.3. El panel 
superior muestra el rendimiento en las tareas primarias, el grado de interferencia 
observada se muestra en el panel del medio y el rendimiento en las tareas 
concurrentes se muestra en el panel inferior. Primero se considera el rendimiento 
en las tareas primarias; está claro que la tarea distractora de los movimientos 
deteriora el recuerdo del lugar espacial que ocupaban los puntos, mientras que la 
tarea del juicio sobre el color, no. En el caso de los ideogramas, ambas tareas 
concurrentes deterioran el rendimiento, siendo significativamente mayor el 
deterioro causado por la tarea del juicio de color. Estas diferencias en el patrón 
de interrupciones se observan más claramente en el panel central, mientras que 
el panel de abajo indica que las dos tareas se ejecutan concienzudamente y que 
este patrón de resultados no refleja una descompensación entre las tareas 
primarias y secundarias. Por tanto, los datos proporcionan una demostración 
clásica de la disociación doble predicha. Klauer y Zhao siguieron confrontando 
esta interpretación con las posibles objeciones discutidas previamente. 


El siguiente experimento puso a prueba la hipótesis de que sus resultados 
podrían deberse a la influencia de las tareas secundarias sobre la percepción o la 
codificación, más que sobre el almacenamiento. Pusieron a prueba esta hipótesis 
retrasando el comienzo de las tareas secundarias hasta que la codificación se 
hubiera completado. El patrón de resultados siguió siendo el mismo. 


Se dieron cuenta de que algunos sujetos decían haber usado una codificación 
verbal para localizar el lugar de los puntos, los cuales se presentaban en cada 
uno de los ocho puntos cardinales en un dispositivo circular. Para evitar esto, 
emplearon una serie de lugares diferentes en cada ensayo, junto con la supresión 
articulatoria. A Klauer y Zhao también les preocupaba que el uso repetido de un 
número limitado de ideogramas pudiera haber dado lugar a una mayor 


contribución de la MLP. Por eso, cambiaron los ideogramas en cada ensayo, 
escogiéndolos al azar de un banco de 512 ideogramas. El patrón de resultados 
general permaneció inalterado, sugiriendo que ni el bucle fonológico ni la MLP 
eran responsables de los resultados previos. 


El cuarto experimento pretendía poner a prueba el argumento de que sus 
resultados pudieran estar reflejando simplemente el grado de similitud entre el 
conjunto de tareas y no la existencia de sistemas de almacenamiento separados. 
Mientras que es difícil argumentar que los ideogramas chinos y los colores sean 
muy similares, uno podría tener razonables motivos para asumir una 
interferencia basada en la similitud entre el lugar de un punto visualmente 
presentado y una serie de asteriscos. Por ello, reemplazaron su tarea de 
movimientos con otra tarea consistente en golpear secuencias espaciales sobre 
un teclado oculto. Una vez más, el amplio patrón de resultados se repitió, y 
golpear tuvo escaso efecto sobre el recuerdo de ideogramas, pero interrumpió 
claramente el recuerdo de puntos, mientras que el procesamiento del color 
mostró de nuevo el patrón contrario. 


Los dos últimos experimentos se dedicaban al posible papel del ejecutivo 
central: ¿el patrón observado podría estar reflejando las distintas cargas del 
ejecutivo sobre las tareas? Esto se puso a prueba pidiendo a los sujetos que 
intentaran generar números aleatorios a una velocidad de uno por segundo a lo 
largo de la tarea. El rendimiento general se redujo, pero el patrón de interferencia 
siguió siendo el mismo. El experimento final también incluía una tercera tarea 
primaria, aritmética, que se suponía que dependía del procesamiento del 
ejecutivo. En esta ocasión, además del golpeo espacial y de los juicios sobre el 
color, también incluyeron una tarea en la que se pedía a los sujetos que 
respondieran lo más rápidamente posible a estímulos que aparecían al azar, una 
tarea que asumieron que interrumpiría el procesamiento del ejecutivo. Sus 
supuestos estuvieron justificados, y esta tarea de relleno interrumpió la tarea 
aritmética más que las tareas de golpes o de colores, mientras que el patrón 
general de resultados permaneció igual, el recuerdo de puntos se veía interferido 
por la tarea espacial de golpes, y la tarea de ideogramas se veía interrumpida por 
la tarea del procesamiento de colores. 


Klauer y Zhao (2004) concluyen que sus evidencias proporcionan un fuerte 
apoyo del fraccionamiento de la memoria visoespacial en un componente visual 
y otro espacial, los cuales no son fácilmente interpretables en términos de una 
descompensación en la asignación de recursos, de diferencias en cuanto a la 


similitud de almacenamiento-procesamiento, de efectos de memoria a largo 
plazo o del procesamiento del ejecutivo. 


No hay duda de que la ingenuidad y minuciosidad con la que Klauer y Zhao 
persiguen este tema tan importante es una verdadera hazaña. Sin embargo, 
sospecho que se podrían suscitar en el lector dos respuestas en conflicto, ambas, 
desde mi punto de vista, equivocadas. Una podría ser que, después de todo este 
esfuerzo, las conclusiones alcanzadas son consistentes con las de los once 
estudios imperfectos revisados por los autores, lo que implica que estos estudios 
fueron innecesarios. Discrepo fuertemente con esto: la disociación potencial 
entre la memoria de trabajo visual y espacial es importante y básica, tanto para la 
psicología cognitiva como para, como veremos más tarde, la neurociencia 
cognitiva. Por tanto, es muy necesario establecerla todo lo firmemente que se 
pueda, usando la mejor y más actual metodología disponible. Sería altamente 
deseable que todas las distinciones propuestas fueran hasta cierto punto objeto 
de una investigación tan cuidadosa y exhaustiva como la proporcionada por 
Klauer y Zhao. 


Una segunda respuesta del lector podría ser que esto se debería convertir en un 
paradigma de investigación para el futuro, publicando solo los artículos que 
sobrevivieran a los rigorosos estándares metodológicos propuestos por Klauer y 
Zhao. Creo que esto también es un punto de vista erróneo. La serie de 
experimentos descritos solo fueron posibles porque se apoyaban en muchos años 
investigación previa, desarrollando conceptos y métodos, que luego dieron lugar 
alos 11 estudios que citan, que a su vez permitieron que Klauer y Zhao 
seleccionaran las tareas y condiciones apropiadas. Pedir siempre estos estándares 
tan rigurosos simplemente constreñiría el campo, impidiendo el desarrollo de 
nuevas líneas de investigación que formaran el campo de cultivo para desarrollos 
teóricos futuros. También sería posible limitar la investigación a esas tareas que 
pudieran ceñirse exclusivamente al ámbito del laboratorio. Como veremos en el 
próximo capítulo, muchas características importantes de la AV se ven 
representadas por su aplicación a complejas tareas que son de considerable 
importancia práctica, pero que no serían susceptibles, al menos por el momento, 
del elegante y detallado análisis representado en el estudio de Klauer y Zhao. 


4.7. Conclusiones 


La evidencia sugiere una clara diferencia entre el almacenamiento a corto plazo 
de los rasgos que representan objetos visuales y los que representan la 
localización espacial. La memoria visual parece ser capaz de mantener cuatro 
objetos, cada uno de los cuales puede comprender múltiples rasgos. Este sistema 
no muestra el típico olvido a corto plazo, incluso cuando se interpone una tarea 
de búsqueda visual entre la presentación y el test, mientras que la MCP espacial 
es sensible a las demandas de cualquier tarea interpolada. Ambos sistemas 
parecen ser capaces de almacenar en orden serial, siempre que se usen estímulos 
relativamente simples. Hay algunas evidencias, aunque menos, de un tercer 
subsistema relacionado con el almacenamiento de acciones, que descansaría en 
un código motor o cinético. Se asume que los tres componentes de 
almacenamiento temporal están coordinados por la agenda visoespacial, un 
sistema que es capaz de manipular información visoespacial como parte del 
sistema de memoria de trabajo general, proporcionando una base para el 
procesamiento cognitivo complejo, como se describirá en el Capítulo 5. 


Notas al pie 


* Un pie equivale a 30,48 centímetros. N, de la T. 
* Del inglés RT, que significa Tiempo de Reacción. N. de la T. 


CAPÍTULO 5 


Imágenes y memoria de trabajo visoespacial 


Se podría decir que las evidencias discutidas hasta el momento se refieren a la 
memoria a corto plazo más que a la memoria de trabajo, ya que prácticamente 
todos los paradigmas tan solo requieren codificar limitadas cantidades de 
material que debe mantenerse brevemente para recordarlo después, o bien 
reconocerlo, sin necesidad de un procesamiento mayor o de una transformación. 
Para una tarea que vaya más allá del simple almacenamiento, y que sea 
merecedora del término de memoria de trabajo, más que del de MCP, uno podría 
esperar una serie de rasgos adicionales. El primero es que se supone que la 
memoria de trabajo es capaz de registrar e incorporar información 
indirectamente, bien desde la memoria a largo plazo, o bien permitiendo una 
codificación intermodal, como cuando, por ejemplo, una secuencia de 
consonantes presentada visualmente se recodifica fonológicamente. Típicamente 
se asume que la memoria de trabajo depende de un sistema de control atencional 
limitado y no simplemente de una capacidad de almacenamiento limitada. 
Finalmente, la idea que subyace al concepto de memoria de trabajo es que presta 
una función general útil al proporcionar una base para las actividades cognitivas 
complejas del mundo real. 


Fue por esta razón por la que mis primeras explicaciones de la agenda 
visoespacial (Baddeley, 1986) comenzaban con los ingeniosos aunque complejos 
paradigmas, desarrollados por Brooks, en vez de comenzar, como en el caso del 
bucle fonológico, con el simple almacenamiento a corto plazo. En esta ocasión, 
habiendo empezado con el almacenamiento básico, estamos en disposición de 
analizar tareas más complejas, y de preguntarnos si estas tareas se pueden 
fundamentar de manera razonable en el almacenamiento dentro de los sistemas 
que se abordan desde los paradigmas más básicos de MCP. ¿De qué podrían 
estar compuestos estos sistemas? 


Como se ha visto, este planteamiento no está tan claro como en el caso de la 
MCP fonológica. La influencia de variables como la similitud está menos clara, 


y el mecanismo o mecanismos para el repaso visoespacial parece ser menos 
obvio y menos fácil de estudiar que el del repaso subvocal. Más aún, mientras 
que parece probable que la información visual, espacial y posiblemente cinética 
se almacene en subsistemas potencialmente independientes, a menudo es muy 
difícil separar dichos sistemas en la práctica. Consecuentemente, en muchos de 
los estudios que se describirán, no estará muy claro si el código visoespacial es 
fundamentalmente visual, espacial, o si de hecho es cinético. Más aún, como los 
paradigmas concretos en los que se basa nuestro conocimiento varían 
sustancialmente, a menudo no está muy claro si los efectos disruptivos de las 
tareas concurrentes actúan deteriorando la codificación, el almacenamiento o la 
recuperación. Finalmente, no existe una interpretación simple y obvia de la 
naturaleza del repaso visoespacial, y los intentos de encontrar un efecto 
visoespacial análogo al efecto de longitud de palabra han recibido escaso apoyo 
(Smith y Pendleton, 1990). Sin embargo, a pesar de estas limitaciones, existen 
considerables evidencias de un sistema visoespacial que actúa en paralelo al 
bucle fonológico como un subcomponente de la memoria de trabajo, un sistema 
al que me seguiré refiriendo como la agenda visoespacial. 


5.1. Codificación visoespacial y memoria verbal 


Allen Paivio (1969; 1971) es el principal responsable de reintroducir el concepto 
de imágenes visuales en el estudio del aprendizaje verbal y de la memoria. Fue 
capaz de demostrar que las palabras que evocan imágenes sensoriales, según 
nuestro propio juicio, eran más fáciles de aprender que las palabras que no las 
suscitan; interpretó sus resultados en términos de la hipótesis de la codificación 
dual. Esta hipótesis propone que las palabras que evocan imágenes se podrían 
recordar no solo en términos de sus características verbales como la sonoridad o 
el significado, sino también en términos de las imágenes que evocan, como se 
refleja en su capacidad para evocar asociaciones cuasi sensoriales. Dado el clima 
neoconductista en el que inicialmente se movía, quizá no sea sorprendente que 
no mencionara si los sujetos experimentaban realmente las imágenes 
visoespaciales, y definió su medida de forma puramente operativa en términos 
de los juicios que emitían los sujetos al pedirles que «Juzgaran las palabras de la 
siguiente lista según la facilidad o dificultad con la que suscitan imágenes 
mentales, ¡.e., una representación mental de un sonido u otra experiencia 


sensorial» (Paivio et al. , 1968, p. 4). 


Así pues, es una medida que paradójicamente se basa en instrucciones que 
asumen que los sujetos al estimar poseen una experiencia consciente, y 
posteriormente esta medida se usa como si fuera una medida objetiva que 
simplemente hubiera aparecido. Esto le permitió a Paivio no ser acusado del 
síndrome de la instrospección, al definir las imágenes de forma operativa y 
tratarlas sencillamente como una dimensión de codificación más, que facilitaba 
el rendimiento de la memoria. 


En el caso de la MCP, aunque la codificación semántica en general y las 
imágenes en particular tienen alguna influencia en la amplitud verbal (Baddeley, 
1966a), los efectos tienden a ser pequeños, al menos en el caso del 
procedimiento estándar basado en la amplitud, en el que se usa de manera 
repetida un conjunto limitado de palabras, y principalmente se enfatiza el 
recuerdo en orden serial, mientras que los efectos son mayores cuando se 
emplean conjuntos de palabras abiertos y secuencias más grandes, en las que el 
recuerdo de los ítems juega un papel más importante (Hulme et al. , 1997). 


5.1.1. Imágenes y memoria a corto plazo verbal 


La mayor evidencia del importante papel que juegan las imágenes en el recuerdo 
inmediato verbal provino inicialmente de una ingeniosa técnica desarrollada por 
Brooks (1967), en la que se pedía a los sujetos que usaran imágenes visuales 
para almacenar material verbal. Consistía en presentar a los sujetos una tarea en 
la que tenían que escuchar y luego repetir una secuencia de frases. En la 
condición clave, era posible usar una matriz de 4 por 4 como apoyo para la 
recodificación visual de las secuencias, ya que todas podían vincularse con la 
matriz. Una celda de la matriz se identificaba como el punto de comienzo, y se 
pedía a los sujetos que recordaran y repitieran una secuencia de frases, como por 
ejemplo las siguientes: Poner un 1 en la celda inicial. En la siguiente celda de la 
derecha poner un 2. En la siguiente de al lado poner un 3. En la siguiente celda 
de la derecha poner un 4, etc. La secuencia siempre iba en aumento, y siempre se 
podía recodificar usando el trazado de la matriz como guía. En una segunda 
condición se impidió esta recodificación reemplazando los adjetivos espaciales 


con otros bipolares equivalentes pero no espaciales, para producir secuencias 
como: Poner un 1 en la celda inicial. En la buena celda siguiente poner un 2. En 
la fuerte celda siguiente poner un 3. En la buena celda siguiente poner un 4. En 
la mala celda siguiente poner un 5, etc. Los sujetos eran capaces de recordar una 
media de ocho frases usando la versión espacial, pero solo cinco cuando usaban 
la tarea no espacial formalmente equivalente, con la que aparentemente usaban 
una codificación fonológica. 


Brooks (1967) mostró que el rendimiento interactuaba con la modalidad de 
presentación; cuando la presentación era auditiva, se favorecía el código 
visoespacial; si por el contrario lo leían, se favorecía el rendimiento de 
secuencias no espaciales. Interpretó sus resultados en términos de una 
interferencia entre el modo de presentación y el modo de almacenamiento; leer 
las frases visualmente presentadas interfería con el código visoespacial de 
matrices y viceversa. 


Me involucré en este tema tras una experiencia personal, cuando escuchaba un 
partido de fútbol Americano, UCLA contra Stanford, mientras conducía por una 
autopista. Tenía una buena imagen del partido, pero noté que daba bandazos de 
un carril a otro y rápidamente cambié a una emisora de música. De vuelta a 
Inglaterra, decidí investigar el efecto combinando la tarea de matrices de Brooks 
con la tarea de seguimiento (Baddeley et al. , 1973). Pedimos a los sujetos que 
ejecutaran las versiones verbales y espaciales de la tarea de Brooks mientras 
realizaban la tarea de seguimiento, que consistía en mantener una aguja en 
contacto con un punto de luz móvil. La tarea de seguimiento dificultaba 
enormemente la versión visoespacial de la tarea de Brooks, pero no tuvo efectos 
sobre la versión no espacial. 


En un estudio posterior (Baddeley y Lieberman, 1980), se trató la cuestión de si 
los sujetos estaban usando un código visual o espacial. Inventamos una tarea 
secundaria puramente visual en la que se pedía a los sujetos que juzgaran la 
luminosidad de una pantalla grande, apretando un botón cuando la luminosidad 
creciera. La tarea no-visoespacial requería que los sujetos con los ojos vendados 
siguieran con una linterna el movimiento de un sonido; cuando la linterna 
coincidiera con el sonido, el sonido emitido cambiaba. Encontramos que esta 
tarea de seguimiento auditivo espacial pero no-visual dificultaba las tareas de 
imágenes visuales de Brooks, mientras que la tarea de la luminosidad visual no. 
La versión verbal de la tarea de Brooks mostró el patrón opuesto, se vio más 
dificultada por la tarea de los juicios de luminosidad que por la tarea de 


seguimiento auditivo. Concluimos que estábamos estudiando imágenes 
espaciales más que visuales. 


La tarea de matrices de Brooks tiene el inconveniente, a pesar de ser ingeniosa, 
de que ambas condiciones demandan muchos recursos atencionales generales. 
Esto se demostró en un estudio de Galway y Logie (1995) en el que se 
combinaban las tareas visoespaciales y verbales de Brooks con la supresión 
articulatoria, con el tamborileo espacial y con la producción verbal aleatoria, una 
tarea que se sabe que demanda una gran carga para el procesamiento ejecutivo 
(Baddeley, 1966c; Baddeley et al. , 1998b). Tal como se pensaba, la versión 
espacial se vio más interrumpida por el tamborileo espacial que por la tarea de 
matrices verbales de Brooks, mientras que ocurrió lo contrario con la supresión 
articulatoria. Sin embargo, la producción verbal aleatoria tuvo incluso un mayor 
impacto sobre ambas versiones, perjudicando más a la versión visoespacial que a 
la verbal, a pesar de que la producción verbal aleatoria es en sí misma una tarea 
verbal. Esto sugiere que el uso de mnemotecnias visoespaciales supone una alta 
demanda de recursos ejecutivos. 


Mayores evidencias de la gran vulnerabilidad potencial de las tareas 
visoespaciales provienen de un estudio de Farmer et al. (1986) que combinaba la 
supresión articulatoria y el tamborileo espacial con una tarea de razonamiento 
verbal y una tarea que incluía transformaciones espaciales. Ninguna de las dos 
tareas concurrentes deterioró significativamente el razonamiento verbal, sin 
embargo, ambas tareas afectaron a la tarea espacial, aunque el tamborileo 
espacial tuvo un efecto mayor. “Tal como muestran los estudios sobre diferencias 
individuales descritos en el Capítulo 11, las medidas del ejecutivo central tienden 
a unirse más fuertemente con tareas supuestamente relacionadas con la agenda, 
más que con medidas del bucle fonológico. 


Continuamos con el estudio del papel de las imágenes visoespaciales en tareas 
de memoria verbal más convencionales, enseñando a nuestros sujetos a utilizar 
mnemotecnias de imágenes espaciales que consistían en situar los ítems a 
recordar sobre una ruta preespecificada a través del campus (Baddeley y 
Lieberman, 1980). Contrastamos este método con un método de aprendizaje 
basado en el repaso verbal memorístico, y encontramos, tal como esperábamos, 
una clara ventaja para la mnemotecnia de imágenes. Sin embargo, cuando se 
combinaba con la tarea de seguimiento usando un rotor de persecución, el 
rendimiento del grupo de las imágenes descendió al mismo nivel que el del 
grupo que usaba el repaso memorístico, en el que la tarea de seguimiento 


concurrente no tuvo efectos. Sin embargo, la tarea de seguimiento tuvo escasos 
efectos sobre una mnemotecnia menos espacial, en la que se asociaban parejas 
de ítems imaginando una interacción visual entre ellos, por ejemplo, para asociar 
león y pipa, uno imagina a un león fumando en pipa (Baddeley y Lieberman, 
1980). Sobre la base de estos estudios concluimos que la agenda visoespacial era 
un sistema principalmente espacial. 


Esto movió a Logie (1986) a presentar un nuevo enfoque alternativo. Sugirió que 
nuestra conclusión acerca de una interferencia espacial más que visual era 
resultado del uso de una tarea de memoria de tipo espacial más que visual. 
Usando la tarea de pares asociados que ya habíamos afirmado que era insensible 
a la interferencia, Logie demostró que podría haber olvido si la presentación 
auditiva de los pares de palabras se acompañaba de material presentado de 
manera visual más que espacial, que el sujeto debía mirar pero ignorar. Los 
dibujos de líneas e incluso manchas de colores fueron suficientes para dificultar 
el uso de imágenes. 


Una serie de estudios posteriores de Quinn y McConmnell (1996a; b; 1999) 
también usaron el repaso memorístico, o las mnemotecnias de imágenes para el 
aprendizaje de pares de palabras. Ellos demostraron que si le pedían al sujeto 
que simplemente observara una pantalla en la que de pronto aparecía un patrón 
de ruido visual compuesto por múltiples píxeles que parpadean al azar, esto era 
suficiente para dificultar la mnemotecnia de imágenes, mientras que no tenía 
efecto sobre el rendimiento en la tarea del aprendizaje memorístico. El habla 
irrelevante tuvo el efecto contrario, dificultó el aprendizaje memorístico pero no 
afectó a la mnemotecnia de imágenes. Sin embargo, debería decirse que aunque 
el efecto de ruido visual se ha replicado en una serie de ocasiones (e.g., 
Baddeley y Andrade, 2000; McConnell y Quinn, 2000), no se ha logrado 
encontrar un efecto robusto (e.g., Andrade et al. , 2002), lo que sugiere que este 
fenómeno aún no está bien comprendido. 


5.1.2. Funciones de la agenda visoespacial 


Hasta ahora nos hemos limitado a discutir el uso potencial de la memoria de 
trabajo visual, sobre todo en cuanto a su valor como ayuda mnemónica. Sin 


embargo, tiene, por supuesto, otros muchos usos. 


Hatano y Osawa (1983a; b) mostraron que usuarios expertos del ábaco eran 
capaces de ejecutar cálculos imaginando simplemente el ábaco, y es más, eran 
capaces de usar la imagen del ábaco como ayuda para recordar secuencias de 
números. Su rendimiento se veía deteriorado por una tarea visoespacial 
concurrente, lo que sugería que el rendimiento estaba dependiendo del uso de la 
agenda. Al igual que el bucle fonológico, la utilización de la agenda es una 
estrategia opcional. En un estudio de Garden et al. (2002), por ejemplo, se 
examinaba la capacidad de los sujetos para aprender una ruta desconocida a 
través de las calles de una ciudad italiana medieval. Mientras tanto, ejecutaban o 
bien la tarea del tamborileo espacial sobre un tablero oculto o bien la supresión 
articulatoria. Previamente se había preguntado a los sujetos por su método para 
orientarse en una ciudad extraña. La tarea visoespacial afectó más a aquellos 
sujetos que utilizaban un mapa mental, mientras que los que se guiaban por 
señales del entorno se vieron más influenciados por la supresión articulatoria. 


5.1.3. Manipulación de la imagen y síntesis mental 


Por supuesto, las habilidades visoespaciales pueden ser muy importantes para 
ciertas carreras como la arquitectura y las ingenierías. También suele haber 
diferencias de género, los hombres son algo mejores en la manipulación espacial 
y la rotación mental que las mujeres, y usan estrategias holísticas con más 
frecuencia, mientras que las mujeres usan un enfoque más secuencial, más 
analítico y más lento (Linn y Petersen, 1985). En un estudio posterior de Hsi et 
al. (1997) se encontraron diferencias de género parecidas entre los estudiantes de 
ingeniería, junto con una correlación significativa entre la manipulación espacial 
y el rendimiento en los gráficos del primer curso de la carrera, un curso en el que 
el 25 por ciento suspende o saca una nota muy baja. Hsi et al. intentaron 
remediar este problema hablando con ingenieros experimentados sobre 
estrategias de manipulación espacial, para después usar esta información en un 
curso intensivo de un día sobre estrategias de manipulación espacial. Como 
resultado, se consiguió mejorar el rendimiento hasta un punto en que 
difícilmente se cometían fallos, y se eliminaron las diferencias de género. 


Una serie de estudios han intentado analizar los procesos subyacentes a esta 
manipulación espacial, y en concreto aquellos procesos que se encargan de 
descubrir las relaciones a través de un proceso de síntesis mental. Finke y 
Slayton (1988) desarrollaron una tarea en la que se pedía a los sujetos que se 
formaran la imagen de una letra y después se les pedía que la manipularan; en 
este punto se les pedía que informaran del objeto representado. Por ejemplo, 
«Imaginad la letra mayúscula J, ahora la D. Girar la letra D 90 grados a la 
izquierda y ponerla encima de la letra J. ¿Qué es lo que parece?» La respuesta es 
un paraguas. Bradimonte et al. (1992) desarrollaron una tarea relacionada en la 
que se daba a los sujetos un estímulo compuesto por diversas partes, y se les 
pedía que eliminaran una parte mentalmente y que informaran del resultado. Por 
ejemplo, les mostraban un óvalo con un triángulo a los lados, con forma parecida 
a un dulce envuelto o a un caramelo. Después se les pedía que quitaran uno de 
los triángulos y que lo redescribieran; la respuesta correcta era un pez. 
Curiosamente, el rendimiento de los sujetos fue mejor con la supresión 
articulatoria, presumiblemente porque así se les forzaba a confiar en el código 
visoespacial más que en la etiqueta verbal. 


Pearson et al. (1999) intentaron analizar los procesos subyacentes a la síntesis 
mental pidiendo a sus sujetos que manipularan cuatro, seis u ocho símbolos (e.g., 
cuadrado, triángulo, círculo, rectángulo) de forma que crearan un objeto 
identificable. Si los sujetos creaban un nombre, luego se les pedía que crearan un 
objeto. Si después de dos minutos no lo habían conseguido, se les pedía que 
recordaran los símbolos constituyentes. El recuerdo de los símbolos descendía 
con el tamaño del conjunto, pero siempre estaba por encima de un acabado 
exitoso, lo que indicaba que el olvido no era el único factor que explicaba el 
fracaso. Para tener una idea de los procesos subyacentes, se pedía a los sujetos 
que realizaran la tarea bajo condiciones de control o bien acompañada de la 
supresión articulatoria o del tamborileo espacial. 


La supresión articulatoria redujo el número de objetos recordados, pero no tuvo 
efecto sobre la capacidad para combinarlos, mientras que el tamborileo espacial 
tuvo el efecto contrario, influyó en su combinación pero no en su recuerdo. En 
estas circunstancias, parece que el bucle fonológico favorece el rendimiento al 
mantener los ítems listos para poder volverlos a visualizar, mientras que el 
proceso de combinación depende más de la agenda. 


5.2. Modelando la agenda visoespacial 


5.2.1. El modelo de la agenda visoespacial de Logie 


Baddeley (1986) tuvo poco que decir sobre la estructura concreta de la agenda, 
simplemente especuló que podía estar formada por componentes visuales, 
espaciales y, posiblemente, léxicos, independientes entre sí, y que probablemente 
mantenía imágenes que servirían como una forma inespecífica de repaso. Logie 
(1995) ha propuesto un modelo más detallado en el cual diferencia entre un 
almacén pasivo, la caché visual y un componente activo, el escriba interno, 
análogos a los componentes de almacenamiento fonológico y de repaso 
articulatorio del bucle fonológico. Logie sugiere que el escriba subyace a los 
aspectos espaciales del sistema, en oposición a los visuales, y que se encarga de 
almacenar la información secuencial, y es responsable de mantener activamente 
la información en el almacén pasivo de la caché visual. Sugiere que el 
movimiento espacial, o de hecho, la planificación interna necesaria para el 
movimiento, es suficiente para interferir en el funcionamiento del escriba interno 
y, por tanto, para interrumpir a la MCP visual. 


Dos estudios arrojaron luz sobre el concepto que tenía Logie acerca de la 
agenda. Bruyer y Scailquin (1998) aplicaron la metodología de la doble tarea 
para analizar los procesos subyacentes a las imágenes visuales. Usaron el 
modelo de Kosslyn (1994) para distinguir entre generar una imagen, mantenerla 
y manipularla, ampliando una serie de tareas ideadas para este propósito por 
Dror y Kosslyn (1994). Estudiaron el efecto que tenían sobre estas etapas de 
tareas secundarias que habían demostrado que interrumpían al bucle fonológico 
(supresión articulatoria), al componente espacial de la AVE (categorizar la 
presencia de tonos a la derecha o a la izquierda) o bien al ejecutivo central 
(generación aleatoria). También manipularon la complejidad de las tareas de 
imágenes, para asegurarse de que se replicaban los fenómenos básicos 
comprobados con las investigaciones previas con imágenes; de hecho, se 
replicaron los efectos relevantes. Tal como se esperaba, la supresión articulatoria 
no tuvo efectos sobre ninguna de las tres etapas de trabajo con imágenes, y, 
además, ninguna de las tareas concurrentes influyó en el mantenimiento de 
imágenes. Sin embargo, tanto la generación de imágenes como la rotación de 


imágenes se vieron interrumpidas por la tarea espacial, y más aún por la 
generación aleatoria. 


Este patrón de resultados es consistente con el modelo de Logie, siempre que se 
asuma que las imágenes generadas pueden ser almacenadas sin repaso. 


El mantenimiento activo por parte del escriba interno debería haber sido 
interrumpido tanto por las tareas secundarias visoespaciales como por las 
ejecutivas. La interferencia observada de estas últimas tareas sobre la generación 
y manipulación de imágenes es consistente con los datos procedentes de la 
memoria para el ajedrez y la capacidad para seleccionar el próximo movimiento 
más adecuado; ambas tareas dependen probablemente de imágenes 
visoespaciales (Robbins et al. , 1996). 


Un rasgo del modelo de Logie es que la caché visual es pasiva, y tan solo el 
escriba interno es capaz de un repaso activo y de la manipulación de imágenes. 
Un estudio reciente de Mohr y Linden (2005) se ha centrado en la distinción 
entre lo visual y lo espacial, usando tareas que permiten el estudio del 
mantenimiento y de la manipulación de imágenes combinando una serie de 
tareas. El paradigma básico incluía dos objetos cuyo color y orientación eran 
críticos, bien para el simple recuerdo, o bien para su manipulación, en cuyo caso 
se pedía al sujeto que combinara y calculara la media de los colores y/o 
orientaciones, respondiendo posteriormente a un test de estímulos. Estas tareas 
se combinaban con la supresión articulatoria o con la generación aleatoria de 
letras. Se obtuvieron dos resultados principales. Primero, la generación aleatoria 
dificultó tanto el color como la manipulación de la orientación, de manera 
consistente con la observación de Bruyer y Scailquin (1998) de que la rotación 
de imágenes parece demandar recursos ejecutivos. El segundo descubrimiento de 
Mohr y Linden fue más sorprendente; sus sujetos eran igual de buenos 
manipulando simultáneamente la orientación y el color que cuando manipulaban 
solo una dimensión. Esto parecería estar sugiriendo procesos manipulativos 
independientes y separados para los sistemas visual y espacial, más que una 
única capacidad limitada del escriba interno que sirva a los dos sistemas. Sin 
embargo, las evidencias respecto a este tema son aún escasas, y todavía no está 
completamente justificado el abandono del concepto de Logie de un único 
proceso de repaso. 


Un segundo rasgo importante del modelo propuesto por Logie es la idea de que 
la información entra en la agenda a través de la memoria a largo plazo, y no 


directamente a través del input sensorial. Esto es muy distinto de la idea 
implícita en muchos de los trabajos previos sobre MCP visual y espacial, y en 
los trabajos más recientes procedentes de la tradición sobre atención visual (ver 
Capítulo 4), y está unido a la idea de que la agenda debería ser considerada como 
un espacio de trabajo mental. 


5.2.2. Heminegligencia perceptiva y representacional 


El supuesto de considerar a la agenda como un espacio de trabajo más que como 
una entrada perceptiva lo discuten Della Sala y Logie (2002) en un capítulo en el 
que se hace un gran uso de la evidencia neuropsicológica. El fenómeno de la 
heminegligencia representacional es de particular importancia. Bisiach y 
Luzzatti (1978) relatan el caso de dos pacientes a los que se les pidió que 
describieran de memoria la plaza de la catedral de Milán, su ciudad natal. En 
ambos casos dieron una buena descripción, excepto que el lado izquierdo de la 
plaza se mencionó con dificultad. Se les pidió entonces que se imaginaran 
andando por la plaza, que dieran la vuelta y que de nuevo intentaran describirla. 
Esta vez el lado izquierdo de la plaza que previamente se desatendía, se describía 
con detalle, y el lado que antes se describía bien, ahora se ignoraba. Baddeley y 
Lieberman (1980) sugirieron que esto podría representar la dificultad del sistema 
para representar la información dentro de la agenda visoespacial, una postura 
que también adoptó Bisiach (1993) en una revisión posterior sobre el tema. 


Por supuesto, una explicación alternativa sugiere que los pacientes sufrían un 
déficit atencional, y no una limitación del almacén o una limitación 
representacional específica de la agenda. La tendencia a ignorar el campo visual 
izquierdo se encuentra a menudo en pacientes con un daño del hemisferio 
derecho. Sin embargo, se han identificado pacientes que mostraban esta forma de 
heminegligencia mnemónica pero sin evidencias de una heminegligencia 
perceptiva equivalente (Beschin et al. , 1997; Coslett, 1997), mientras que otros 
muestran heminegligencia perceptiva en ausencia de cualquier signo de 
heminegligencia cuando se les pide que describan representaciones mentales. 
Beschin et al. (2000) estudiaron a un paciente que había sufrido dos apoplejías 
seguidas, una en el lóbulo parietal/occipital y la otra en el tálamo derecho. El 
resultado fue una severa heminegligencia perceptiva para el material presentado 


en el área del hemisferio derecho, pero sin que hubiera heminegligencia 
representacional derecha, mientras que el daño en el tálamo derecho sí produjo 
heminegligencia representacional izquierda en ausencia de heminegligencia 
perceptiva izquierda. 


Claramente, estos datos apoyan un sistema de memoria de trabajo visoespacial 
que no actúa simplemente como una entrada perceptiva. Más aún, el hecho de 
que la agenda se pueda activar mediante la pronunciación de palabras, como en 
el caso de la tarea de matrices de Brooks, o de las mnemotecnias verbales 
basadas en imágenes visuales, claramente redunda en el mismo punto, ya que 
ambas dependen del uso del conocimiento a largo plazo para pasar las palabras 
presentadas auditivamente a un código visoespacial. 


Sin embargo, me siento menos cómodo con la sugerencia de Logie de que toda 
la información pasa a través de la MLP antes de alcanzar la agenda. En primer 
lugar, parece que implicaría un estricto flujo serial de la información, aunque de 
forma poco convencional, desde la MLP a la MCP. Un procesamiento serial fijo 
en cualquiera de las dos direcciones parece simplista. Parece que se estuviera 
asignando el mismo estatus a una forma sin significado, que se viera situada en 
un campo de visión abierto, que a una imagen compleja con significado creada 
como respuesta a una descripción verbal. Por supuesto, la forma no es procesada 
por un sistema totalmente simplista, pero la importancia de la MLP en este 
contexto está lejos de ser clara. Yo prefiero asumir que la información 
visoespacial se puede codificar en la agenda, bien perceptivamente, bien desde la 
MLP o bien mediante una combinación de ambas. Por tanto, aunque acepto 
totalmente que la agenda es, o al menos forma parte de, un espacio de trabajo 
mental, no le puedo ver ninguna ventaja a la propuesta de que el acceso se tenga 
que hacer inevitablemente a través de la memoria a largo plazo. 


5.3. Imágenes visuales 


Implícitamente, todo el trabajo descrito hasta el momento ha implicado a la 
memoria para material visoespacial. Sin embargo, en términos de publicaciones, 
es probable que haya habido muchos más trabajos acerca del estudio de las 
imágenes visuales, muchos de los cuales se concentran en el tema de si las 


imágenes podrían ser consideradas de manera análoga a la percepción. Como 
considero que este trabajo está relacionado con la memoria de trabajo, lo 
describiré al menos brevemente. Richardson (1999) da una perspectiva histórica 
más detallada. 


5.3.1. Rotación mental 


Mucha de la investigación con imágenes se vio estimulada por la clásica 
demostración de Shepard y Metzler (1971) en la que se pedía a los sujetos que 
juzgaran si las representaciones tridimensionales de dos objetos eran idénticas, o 
si una era el espejo de la otra. Los dos objetos se presentaban con orientaciones 
relativas diferentes. El tiempo de respuesta demostró ser función lineal de la 
distinta orientación de los dos objetos, justo como si los sujetos rotaran 
mentalmente uno de los objetos hasta alinearlo con el otro y luego emitieran el 
juicio. Se obtuvieron resultados semejantes con estímulos de letras familiares 
(Shepard y Cooper, 1982) y con una tarea que implicaba doblar mentalmente un 
patrón bidimensional para crear un objeto tridimensional (Shepard y Feng, 
1972). Shepard se dio cuenta de la gran semejanza de esta tarea con la ejecución 
real del acto, y se refirió a ella como «rotación mental», observando que parecía 
asemejarse a un proceso análogo continuo, más que a una serie de pasos 
discretos. Sin embargo, no relacionó sus descubrimientos con la experiencia 
consciente. 


5.3.2. Escaneando la imagen mental 


Kosslyn (1978; 1980) adoptó una visión igualmente agnóstica acerca de la 
conciencia, sugiriendo que los sujetos son capaces de escanear las imágenes 
visuales de una manera que se parece mucho a escanear abiertamente una escena 
visual. Por ejemplo, si se le da a un sujeto el dibujo de un perro, luego se lo 
quitas y le haces preguntas sobre el dibujo, tardará más en responder si a la 
pregunta sobre la nariz le sigue una pregunta sobre el rabo, que si hubiera tenido 
que responder a una pregunta acerca de un rasgo más cercano a la nariz, como 


las orejas del perro; parece como si la atención se tuviera que desplazar más para 
llegar hasta el rabo. En otro estudio se enseñó a los sujetos la geografía de una 
isla imaginaria y luego se les pidió que respondieran a preguntas acerca de sus 
distintos emplazamientos. Una vez más, el tiempo de respuesta dependió de la 
distancia entre un lugar y otro (Kosslyn, 1980). Kosslyn describe otras muchas 
maneras en las que encuentra que este «escaneado interno» se parece 
exactamente a su forma externa, interpretando sus resultados a través de un 
modelo altamente complejo. Este incluía cinco «producciones» separadas, cada 
una de las cuales implicaba transformar la entrada para producir una nueva 
estructura de datos. Cada una de las cinco era capaz de «transformaciones 
alteradas» que cambiaban la estructura básica de los datos, haciendo que 
estuvieran disponibles para un proceso de comparación. El modelo se simuló 
computacionalmente, y se usó para dar cuenta de un amplio rango de resultados 
(Kosslyn y Shwartz, 1977). 


Sin embargo, los métodos de Kosslyn han sido fuertemente criticados. En 
concreto, se sugirió que sus sujetos simplemente estaban utilizando los 
conocimientos sobre percepción para simular la percepción, usando una 
estrategia que podía ser o no relevante para los procesos que realmente subyacen 
a sus juicios. Intons-Peterson (1996) mostró que la velocidad del «escaneado 
visual» variaba dependiendo de factores semánticamente relevantes pero no- 
visuales, como, por ejemplo, si los sujetos se imaginaban a sí mismos cargando 
con un peso o no. Un proceso posterior mostró que las expectativas no-visuales 
influían en los sujetos, incluso cuando dichas expectativas eran falsas (Jeannerod 
et al. , 1994). Igual de problemático para la interpretación de Kosslyn fue el 
estudio de Hinton y Parsons (1988), que pidieron a sus sujetos que se imaginaran 
un cubo metálico situado en un estante frente a ellos. Después, se les pidió que 
agarraran la esquina inferior derecha más cercana a ellos y la esquina izquierda 
más lejana, y que orientaran el cubo de forma que su mano izquierda se situara 
por encima de su mano derecha. La tarea consistía en describir la situación del 
resto de las esquinas. Casi todos informaron que se habían situado sobre una 
línea horizontal, tal como a la mitad del cubo. En realidad, habían tomado forma 
como de corona. Hinton y Parsons sugieren que, más que manipular la 
representación como Shepard o Kosslyn hubieran sugerido, los sujetos intentan 
simularla. Cuando el problema es complejo, simplemente fallan. 


5.3.3. El protomodelo de Kosslyn 


Kosslyn (1994) desvió su atención lejos de su original procedimiento de 
escaneado de imágenes, y se concentró en un detallado análisis neurobiológico 
de la percepción, para perfilar lo que él describe como «un protomodelo» para la 
percepción y las imágenes. El modelo posee 15 componentes, pero, al igual que 
en su primer modelo, se supone que las imágenes dependen de una ventana 
atencional que funciona sobre un búfer visual. Se supone que este búfer está 
situado en la corteza visual primaria, una conclusión que inicialmente parece 
apoyarse en los datos de neuroimagen (Kosslyn et al. , 1993). Sin embargo, 
mientras que algunos estudios posteriores apoyan esta idea (Kosslyn et al. , 
1999), otros la rechazan (e.g., Cohen et al. , 1996; Mellet et al. , 1995). 


Estas desavenencias sobre la localización son fácilmente explicables si se acepta 
que las imágenes visoespaciales tienen al menos dos componentes separados, 
con localizaciones anatómicas separadas. Algunas evidencias neuropsicológicas 
sugieren que el componente visual es más probable que se encuentre 
principalmente en los lóbulos occipitales, el componente espacial en los lóbulos 
parietales y el control ejecutivo probablemente dependa de las áreas frontales 
(Smith y Jonides, 1997; 1999). La memoria de trabajo visual ha mostrado este 
mismo patrón de activación en una serie de ocasiones (ver Capítulo 12). 


Más evidencias de estas diferencias provienen de la literatura neuropsicológica, 
con pacientes que muestran un deterioro en su capacidad para ejecutar tareas 
espaciales, pero mantienen preservada su capacidad para las imágenes visuales, 
mientras que otros pacientes muestran el patrón contrario. Luzzatti et al. (1998) 
describen a un paciente, E. P., con daños en el hemisferio temporal derecho y en 
el hipocampo, que posee dificultades para las tareas espaciales como la rotación 
mental, la tarea de matrices de Brooks o la de los bloques de Corsi, pero es capaz 
de realizar tareas que requieren imágenes visuales pero no espaciales, por 
ejemplo, recuperar una imagen de la memoria a largo plazo para describir las 
orejas de un perro salchicha, el color de un plátano o la forma del estado de 
Carolina. Otros pacientes con el mismo patrón de deterioro espacial pero con 
capacidad para las imágenes visuales intacta se describen en Hanley y Davies 
(1995) y en Carlesimo et al. (2001). 


Wilson et al. (1999) informan del caso de una escultora (L.E.) que mostró el 
patrón opuesto. Demostraba un buen procesamiento espacial y una buena 
actividad motora, con un rendimiento dentro de lo normal en la tarea de los 


bloques de Corsi, y sin dificultades para seguir el complejo camino de ida y 
vuelta en coche desde el laboratorio de neuropsicología. Sin embargo, parecía 
que había perdido su capacidad para crear imágenes visuales. Su rendimiento fue 
pobre en la tarea de amplitud de patrones, y aunque había sido muy buena 
escultora de estilo realista, decía que no podía recordar cómo era ninguno de sus 
trabajos. Su actual estilo se había vuelto muy abstracto, y su capacidad para 
hacer dibujos realistas a partir de sus recuerdos era casi inexistente. Farah et al. 
(1998) describen un caso similar de un paciente (L.H.) con un procesamiento 
espacial preservado, un buen rendimiento en la rotación mental, el escaneado 
mental y la memoria para los lugares, mientras que mostraba un deterioro para la 
memoria de colores, tamaños y formas de los objetos. 


5.3.4. Memoria de trabajo y la experiencia con imágenes 


Aunque no lo he dicho explícitamente, siempre he pensado que nuestros 
experimentos en los que se usaba la tarea de Brooks, como la del golpeteo de 
imágenes, se experimentaban fenomenológicamente. 


Sin embargo, los intentos de estudiar la fenomenología de las imágenes han 
resultado ser sorprendentemente frustrantes. No hay duda de que algunas 
personas dicen haber tenido experiencias cuasi-visuales cuando recordaban una 
escena. Galton (1880) pidió a una serie de eminentes caballeros Victorianos que 
informaran de sus mesas de desayuno y encontró que las personas se 
diferenciaban mucho en sus juicios respecto a la viveza de sus imágenes, desde 
una viveza semejante a la experiencia perceptiva hasta los que negaban cualquier 
tipo de experiencia cuasi- visual. Hay una gran tradición de trabajos que 
emplean estimaciones subjetivas con imágenes, muchos de ellos emplean 
cuestionarios como el de Betts (1909). Sin embargo, hay pocas evidencias de 
que estas medidas puedan predecir el comportamiento real. DiVesta et al. (1971) 
examinaron a una gran muestra de participantes usando medidas subjetivas con 
imágenes y un amplio rango de tareas de memoria. La única medida que 
correlacionó con las estimaciones sobre la fortaleza de las imágenes fue la 
deseabilidad social, una medida que informa de lo mucho que los sujetos desean 
agradar. Estudios posteriores han encontrado algunas veces asociaciones entre 
las autoestimaciones y la memoria visual, aunque son bajas y tienden a ser 


negativas (Heder et al. , 1986; Reisberg et al. , 1986). 


Mi propia implicación en la exploración de los aspectos fenomenológicos de la 
memoria de trabajo provino de una invitación para contribuir en un libro sobre 
imágenes auditivas (Baddeley y Logie, 1992). Comencé a darme cuenta del poco 
apoyo que tenía mi suposición implícita de que las imágenes representaban una 
actividad dentro de los sistemas esclavos de la memoria de trabajo. Jackie 
Andrade y yo decidimos estudiar esta cuestión directamente (Baddeley y 
Andrade, 2000). 


5.3.5. ¿Qué es lo que da viveza a las imágenes? 


Nuestra hipótesis básica era muy simple; concretamente, que las imágenes 
auditivas representan una actividad dentro del bucle fonológico, y las imágenes 
visuales, la actividad equivalente en la agenda. Asumimos que la supresión 
articulatoria y la espacial influirían de forma diferente sobre ambas. También 
asumimos que ambos tipos de imágenes dependerían parcialmente del ejecutivo 
central. Sin embargo, al combinar siempre las imágenes visuales y las espaciales, 
esperábamos usar la interacción entre el modo de las imágenes y el modo de 
interrupción como indicación de la contribución específica de los dos 
subsistemas, más allá de cualquier efecto atencional que resultara al pedir que 
combinaran las imágenes con las tareas concurrentes. Por tanto, si la supresión 
articulatoria reduce la viveza de las imágenes auditivas más que la de las 
visuales, y si lo contrario ocurre con las imágenes visuales, entonces nuestros 
resultados no se pueden interpretar fácilmente en términos de un único sistema 
como el del ejecutivo central. 


Teníamos un problema más: cómo medir la viveza. Decíamos que el problema 
de las diferencias individuales en los trabajos previos era que los cuestionarios 
que se usaban requerían implícitamente que los sujetos compararan su propia 
experiencia con la de los demás. Propusimos usar un diseño intrasujeto, en el 
que los sujetos juzgaban la viveza de sus imágenes bajo una serie de condiciones 
diferentes, usando por tanto de manera implícita la viveza percibida en la 
condición control como línea base personal. De esta manera esperábamos 
conseguir una medida más sensible. 


Nuestro método, por tanto, implicaba inducir una imagen, bien mediante la 
percepción visual o bien auditiva, o bien basándonos en el conocimiento a largo 
plazo de los sujetos. Tenían que mantener la imagen durante diez segundos, 
durante los cuales debían evaluar su viveza y luego responder a una escala con 
un rango del 1 (ausencia total de imagen) al 5 (tan viva como la percibida). 
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Fig. 5.1. Influencia de tareas secundarias visoespaciales y verbales sobre la 
estimación de la viveza de las imágenes para conjuntos de formas y patrones de 
tonos presentados recientemente. Los puntos blancos representan estímulos 
auditivos, y los negros representan estímulos visuales. Datos procedentes de 
Baddeley y Andrade (2000). 


Nuestros estudios iniciales implicaban presentar, bien un conjunto de formas 
estándar, como círculos, cuadrados, corazones, etc., o bien una secuencia de 
tonos. Durante el intervalo de diez segundos, el sujeto quedaba libre, o bien 
debía ejecutar concurrentemente una tarea de supresión articulatoria o de 
tamborileo espacial. La Fig. 5.1 muestra el método y los resultados de nuestro 
estudio inicial, del que emergen una serie de puntos. Primero, todos nuestros 
sujetos parecieron considerarla una tarea natural, y nadie en este estudio ni en 
otros posteriores declinó participar aludiendo que no tuvieran imágenes visuales. 
Segundo, ambas tareas causaron un decremento en ambos tipos de imágenes, lo 
que sugiere un efecto general de la doble tarea que asumimos que era atribuible 
al papel del ejecutivo central. Sin embargo, lo más crucial fue que obtuvimos 
una clara interacción; la supresión articulatoria llevó a los sujetos a estimar sus 
imágenes auditivas como menos vivas, mientras que el tamborileo espacial 
redujo la viveza subjetiva de las imágenes visuales. 


5.3.6. El papel de memoria a largo plazo 


En otra serie de estudios, guiamos a los sujetos verbalmente para que se 
formaran imágenes desde la MLP, por ejemplo, la imagen auditiva de alguien 
hablando por teléfono o andando sobre la grava, o una imagen visual de algún 
paisaje local, como, por ejemplo, la Capilla del Kings College o el Mercado de 
Cambridge. Bajo estas circunstancias continuamos obteniendo un déficit general 
en las tareas secundarias de tamaño considerable, lo que sugería una importancia 
continua del ejecutivo central junto con una interacción significativa, aunque la 
magnitud de la interacción fue mucho menor. A lo largo de una serie de 
experimentos, detectamos la influencia de una serie de variables sobre la 


valoración general de la viveza de imágenes verbalmente inducidas. Así, las 
imágenes en movimiento eran menos vivas que las estáticas, y las imágenes 
extrañas, como un cisne comprando, fueron valoradas con menor viveza que las 
escenas más normales, como una mujer comprando. No parece que esto sea 
resultado de haber obligado a los sujetos a proporcionar una respuesta esperable, 
dado que los sujetos primerizos predijeron que las imágenes raras serían más 
vivas, pero de hecho fueron valoradas como menor viveza que los episodios más 
convencionales. 


Estas imágenes verbalmente generadas estaban basadas presumiblemente en 
información recuperada a partir de la MLP. No se ajustaron a nuestra hipótesis 
inicial, según la cual hubiéramos continuado prediciendo una fuerte interacción 
entre las tareas secundarias y el modo de generación de las imágenes. En 
cambio, sí obtuvimos grandes efectos de variables de MLP, como la complejidad 
O la rareza, que no se habían predicho. Sugerimos que nuestros resultados se 
podrían interpretar de la siguiente manera. Empezamos rechazando la idea 
implícita en nuestra hipótesis inicial de que una imagen es como un cuadro, una 
imagen viva es un cuadro rico y detallado, mantenido por la agenda o el bucle. 
En su lugar, propusimos que una imagen representa información cuasi-sensorial 
que se recupera o bien del importante subsistema de memoria de trabajo o bien 
de la MLP. Por tanto, cuando yo mismo digo que tengo una imagen viva del 
Mercado de Cambridge, quiero decir que puedo imaginar un puesto de flores 
concreto, al hombre que lo atiende y produzco internamente un conjunto 
convincente de variedades de flores que podrían estar vendiéndose. Casi con 
toda seguridad no es una grabación exacta de las muchas experiencias de esta 
escena, sino que es una construcción a partir de mi memoria personal semántica, 
una representación genérica que resulta de los muchos encuentros con el puesto 
y con las flores. El grado de viveza de esta imagen reflejaría entonces la cantidad 
de detalles cuasi- sensoriales posiblemente disponibles que se pueden recuperar 
de la memoria de trabajo o bien de la MLP. 


Pruebas de esta interpretación provinieron de un último estudio en el que 
presentamos a nuestros sujetos dibujos coloridos de pájaros británicos, 
proporcionándoles el nombre del pájaro y algún dato básico. A continuación se 
les daba el nombre del pájaro y se pedía a los sujetos que se formaran una 
imagen y juzgaran su viveza. Anteriormente habíamos pedido a nuestros sujetos 
que estimaran su conocimiento sobre los pájaros, y afortunadamente se pudieron 
formar dos grupos aproximadamente iguales, uno con un conocimiento al menos 
moderado y el otro con un conocimiento menor. Encontramos que el 


conocimiento de los pájaros estaba muy asociado con la estimación de la viveza 
de la imagen del dibujo que se había mostrado. Por supuesto, esto podría reflejar 
simplemente la manera en que la gente responde habitualmente a los 
cuestionarios; las personas que se muestran cautas valorando sus conocimientos 
sobre los pájaros probablemente también son cautas a la hora de valorar la 
viveza de sus imágenes. Afortunadamente fuimos capaces de descartar esta 
posibilidad en un segundo estudio usando los mismos sujetos. Regresamos a 
nuestro procedimiento anterior consistente en presentar una serie de círculos, 
cuadrados y triángulos, e inmediatamente después, pedir el juicio acerca de la 
viveza de la recolección. En esta ocasión, la presentación era o bien corta o bien 
una exposición más larga. Predijimos que una exposición mayor permitiría una 
mejor codificación del nuevo patrón, dando lugar a una huella más duradera, a 
una información más cuasi-sensitiva y a un mayor nivel de viveza percibida. 
Hubo una clara diferencia en las valoraciones posteriores sobre la viveza, ya que 
exposiciones más largas dieron lugar a imágenes más vívidas. Más aún, no 
encontramos correlación entre el nivel medio de viveza estimada en los dos 
experimentos, lo que descartaba la interpretación propuesta en términos de 
diferencias en cuanto al grado de cautela expresada por los sujetos en la tarea de 
valoración de sus experiencias subjetivas, y apoyaba nuestras interpretaciones de 
los experimentos previos en términos del grado de conocimiento. 


5.3.7. Implicaciones para el modelo de memoria de trabajo 


¿Cómo afectaban nuestros resultados a la interpretación de las imágenes a partir 
de la memoria de trabajo? De alguna manera fueron muy esperanzadores. 
Habíamos demostrado que es posible obtener datos coherentes y consistentes 
usando autoevaluaciones sobre la viveza. Es más, habíamos encontrado 
consistentemente nuestra interacción predicha. Sin embargo, la magnitud de este 
efecto era realmente pequeña en los casos en los que las imágenes dependían de 
información recuperada a partir de la MLP, lo que apoyaba nuestra interpretación 
revisada. Sin embargo, lo más significativo era que no habíamos respondido a la 
pregunta de cómo los sujetos mantenían las imágenes mientras juzgaban su 
viveza. Estaba claro que no se mantenía en los sistemas esclavos, ya que los 
efectos dependientes de la modalidad eran muy pequeños. ¿Podrían mantenerse 
en el ejecutivo central? Sin embargo, a estas alturas habíamos abandonado la 


idea de que el ejecutivo tuviera capacidad para almacenar información, 
proponiendo que funcionaba simplemente como un sistema de control atencional 
(Baddeley y Logie, 1999). Lo cual solo nos dejaba con dos alternativas, asumir 
que todo esto ocurría en la MLP, o bien plantear un cuarto sistema de memoria 
de trabajo. Volveré sobre este tema en el Capítulo 8, en el que se propone y se 
discute un cuarto componente de la memoria de trabajo, el búfer episódico. 


5.4. Conclusiones 


¿En qué lugar queda el concepto de la agenda visoespacial? ¿Es una forma de 
percepción atencionalmente acrecentada, como lo hubiera sugerido el capítulo 
anterior? ¿O es quizá un espacio de trabajo post-MLP, como sugirieron Della 
Sala y Logie (2002)? Estas alternativas no son, por supuesto, mutuamente 
excluyentes, pero difieren en el énfasis que ponen unos y otros investigadores, 
los del campo de la atención visual acentúan factores atencionales y de 
codificación, y los de la tradición en memoria de trabajo ponen más énfasis en la 
manipulación de los procesos ejecutivos. Es probable que estos enfoques 
interactúen pronto y se fundan usando cada vez más las evidencias en 
neuroimagen (ver Capítulo 10), y los estudios basados en el registro de una sola 
unidad en animales (Goldman-Rakic, 1996). Los vínculos con las líneas de 
investigación clásicas sobre imágenes visuales son menos directos, por una serie 
de razones. Primero, porque esta área está en sí misma fragmentada. Muchos de 
los trabajos más influyentes, como el de Shepard y el de Kosslyn, no han estado 
relacionados con la memoria, y han evitado explícitamente cualquier vínculo 
directo con las experiencias fenomenológicas, ambos rasgos del enfoque 
asociados con el modelo de memoria de trabajo. El enfoque de la AVE sobre las 
imágenes visuales también se ha basado fuertemente en estudios de casos 
neuropsicológicos, y, a diferencia de la mayoría de los trabajos experimentales, 
se ha dedicado básicamente a temas de aplicación práctica, ya fueran clínicos, 
ergonómicos o educativos (Andrade et al. , 1997; Logie, 1995; Della Sala y 
Logie, 2002). 


En resumen, creo que la agenda es un subsistema que ha evolucionado hasta 
poder proporcionar una manera de integrar la información visoespacial desde 
múltiples fuentes, visuales, táctiles y cinéticas, así como desde la MLP tanto 


episódica como semántica. De este modo, asumo la existencia de un acceso tanto 
perceptivo como desde la MLP. Los lectores del Capítulo 8 verán semejanzas 
entre esta perspectiva y las características atribuidas al búfer episódico que allí 
se describe. Un reto más teórico y empírico para el modelo de la MT es explorar 
esta interfaz hipotética entre la agenda y el búfer episódico. Parece que hay un 
sistema que se encarga específicamente de integrar información visoespacial. 
¿Este sistema alimenta entonces un sistema integrador de nivel superior, y si es 
así, es parte de una jerarquía más grande? Volveremos a este tema en el Capítulo 
8. Finalmente, como se ilustra en el Capítulo 10, el rápido desarrollo de la 
neuroimagen proporciona una herramienta potencialmente poderosa que podría 
ayudar a integrar los diversos enfoques en la memoria de trabajo visoespacial. 


CAPÍTULO 6 


Recencia, recuperación y la regla de la ratio constante 


Durante los años 1960, el término MCp se aplicó a cualquier paradigma que 
implicara presentar material y luego ponerlo a prueba desde cero hasta 30 
segundos más tarde. Esta fue un área de investigación muy activa, en la que los 
investigadores venían de dos tradiciones más bien distintas. una, la teoría de la 
interferencia asociativa, que se comprometió con un concepto de memoria 
unitario, estudiado mediante un rastreo de las variables que controlaban el 
aprendizaje y el olvido, por lo que típicamente se siguió explicando la memoria 
en términos de un rango limitado de principios asociacionistas de estímulo- 
respuesta. a menudo, el término aprendizaje verbal fue aplicado a este enfoque, y 
sus principales protagonistas fueron arthur Melton (1963), leo postman y Benton 
underwood (postman y uderwood, 1973). 


Por el contrario, el segundo enfoque asumió sistemas de memoria a largo plazo y 
a corto plazo separados. Era mucho más proclive a especular sobre posibles 
mecanismos, concretamente usando el ordenador como metáfora, y tomando su 
terminología del procesamiento de la información. Este enfoque se constituyó 
como un importante componente de la psicología cognitiva recién desarrollada, 
y estuvo representado por figuras como Broadbent (1958) y Conrad (1967), en 
Gran Bretaña, y Miller (1956), Neisser (1967) y posner (1967), en EE.uu. 


6.1. Recencia en recuerdo libre 


6.1.1. Recencia como memoria a corto plazo 


Una de las principales fuentes usada como prueba de la distinción entre la MCp 
y la MIp fue el efecto de recencia en el recuerdo libre, es decir, la tendencia a 
recordar bien los últimos ítems presentados. El efecto desaparece rellenando una 
demora de unos pocos segundos (Glanzer y Cunitz, 1966), independientemente 
de que el material de relleno sea o no parecido a los ítems. la recencia se 
encuentra en pacientes fuertemente amnésicos, a pesar del deterioro de su Mlp 
(Baddeley y Warrington, 1970), pero está ausente o muy reducida en pacientes 
con MCp deteriorada (Shallice y Warrington, 1970). Más aún, el efecto de 
recencia es insensible a un gran número de variables como la tasa de 
presentación, la precisión de las palabras, la distracción atencional y el 
envejecimiento, que tienen un marcado efecto sobre el recuerdo de los primeros 
ítems en una lista de recuerdo libre (Glanzer, 1972). por tanto, la recencia parece 
representar una de las evidencias más fuertes a favor de la distinción entre la 
MCp y la MIp. 


6.1.2, Recencia a largo plazo 


Sin embargo, poco a poco se fue haciendo más claro que el efecto de recencia 
iba más allá de la MCp. Bjork y Whitten (1974) y tzeng (1973) mostraron un 
claro efecto de recencia en el recuerdo tras una demora rellena, siempre que los 
ítems a recordar estuvieran a su vez separados por una demora rellena. Baddeley 
y Hitch (1977) encontraron que al recordar partidos de rugby la recencia se 
extendía a unas cuantas semanas. la observación hecha por Baddeley y Hitch 
(1977) de que la recencia no se veía afectada por una tarea concurrente como la 
amplitud de memoria de dígitos, fue una prueba de la distinción entre los 
procesos implicados en la recencia en el recuerdo libre verbal y la amplitud de 
memoria verbal. Si hubieran dependido del mismo almacén a corto plazo con 
una capacidad limitada, como propone por ejemplo el modelo de atkinson y 
Shiffrin (1968), los dígitos concurrentes habrían eliminado la recencia. ahora ya 
se acepta de manera generalizada (e.g., Baddeley, 1998b; Nairne, 2002) que el 
efecto de recencia es un fenómeno robusto, considerablemente generalizado y 
que no está limitado a la MCp. 


El efecto de recencia se puede describir brevemente y de forma precisa. a lo 
largo de una gran variedad de situaciones que van desde segundos hasta años, la 


probabilidad de recordar un ítem dado es una función constante que depende de 
dos variables, la distancia temporal entre un ítem y su competidor más cercano 
(At) dividido entre el intervalo de presentación entre un ítem y el test (t). Esto se 
denomina razón de discriminación, y se ha demostrado que se mantiene 
constante a lo largo de una amplia serie de circunstancias. En el recuerdo 
inmediato, los ítems más recientes se ven favorecidos, pero la ventaja desaparece 
cuando el recuerdo se retrasa. 


6.1.3. ¿Desvanecimiento de la huella o interferencia? 


El efecto de recencia se muestra más claramente en el clásico paradigma de 
recuerdo libre en el que los sujetos intentan recordar una lista, típicamente de 15- 
20 palabras, en el orden que ellos quieran. Sin embargo, el efecto no se limita al 
recuerdo libre. Consideremos, por ejemplo, el paradigma del olvido a corto plazo 
de peterson y peterson (1959), en el que los sujetos intentan recordar un trigrama 
de consonantes tras una demora rellena que oscila entre los 3 y los 18 segundos. 
El recuerdo disminuye rápidamente en función de la demora. los peterson 
rechazaron una interpretación en términos de una interferencia asociativa 
estímulo-respuesta sobre la base de que la tarea concurrente, contar, era muy 
diferente a la tarea de memoria basada en letras; los estudios de Mlp han 
demostrado que la semejanza es esencial para que haya interferencia (McGeoch 
e Irion, 1952). aunque se ha admitido la importancia de la semejanza en la MIp, 
los peterson sugirieron que sus resultados reflejaban el desvanecimiento 
espontáneo de una huella independiente de memoria a corto-plazo. Esta 
conclusión demostró ser prematura. tal como Keppel y underwod (1962) 
elegantemente demostraron, el grado de olvido de la primera letra de la 
secuencia a examinar es mínimo. la función de olvido aumenta rápidamente a lo 
largo de secuencias posteriores hasta estabilizarse después de cuatro o cinco 
pruebas. por eso sugirieron que este olvido era resultado de la interferencia 
proactiva, por la que los primeros ítems interfieren con el recuerdo del material 
posterior, justo como ocurre en la Mlp (underwood, 1957). 


La investigación posterior reforzó la conclusión de que la interferencia entre 
ítems era una variable crucial, aunque Baddeley y Scott (1971) proporcionaron 
evidencias de que incluso cuando el examen se limita a un solo ítem se da un 


olvido significativo aunque modesto, pero es total después de 5 segundos. Se ha 
sugerido que el olvido podría deberse a una interferencia mutua entre los ítems 
de la secuencia (Nairne, 2002). Según esta interpretación, la tasa de olvido se 
incrementaría con el número de ítems a recordar. Baddeley y Scott no 
encontraron evidencias de esta relación. 


Sin embargo, aunque no se puede descartar que la huella de desvanecimiento 
contribuye mínimamente, está claro que la mayor parte del olvido presente en el 
paradigma de Brown-peterson se debe a algún tipo de interferencia, aunque no 
necesariamente tiene que ser la que conforma los supuestos asociacionistas E-R 
clásicos (ver Baddeley, 1976, pp. 124-131, para más detalles). En un elegante 
artículo de turvey et al. (1970) se arroja algo de luz sobre esta cuestión en un 
estudio que se aleja del diseño estándar según el cual se examina el recuerdo de 
cada sujeto a lo largo de una serie de intervalos de demora ordenados al azar. En 
cambio, turvey et al. limitaron cada conjunto de sujetos a una única demora. por 
ejemplo, a un grupo siempre se le examinaba tras una demora de 5 segundos, 
otro después de 10 segundos y otro después de 25 segundos. Bajo estas 
condiciones, hasta cierto punto sorprendentes, la demora no afectó a la cantidad 
recordada, y los sujetos examinados después de 25 segundos recordaron tanto 
como los examinados tras 5 segundos. Sin embargo, independientemente de la 
demora que hubieran experimentado previamente, turvey et al. incluyeron una 
última prueba en la que todos los sujetos experimentaban una misma demora de 
15 segundos. Bajo estas circunstancias se dieron grandes diferencias entre los 
grupos, y aquellos sujetos que habían experimentado una corta demora 
mostraron mucho peor rendimiento que los sujetos que previamente habían 
experimentado demoras largas. 


6.2. La regla de la ratio constante 


Estos resultados se explicaron fácilmente en términos de la hipótesis de la ratio 
constante (Baddeley, 1976). Si el problema del sujeto es discriminar entre el ítem 
que se acaba de presentar (el ítem target) y el ítem inmediatamente anterior, 
entonces los sujetos sometidos a una demora regular de 5 segundos tendrán que 
discriminar entre el ítem target cada 5 segundos y los ítems previos 
competidores que aparecieron 5 segundos antes del ítem target, es decir, una 


ratio de 5 sobre 10 segundos (¡.e., 0,5). los sujetos sometidos a una demora 
regular de 25 segundos necesitarán discriminar el ítem target aparecido 25 
segundos atrás de los ítems previos competidores presentados 50 segundos antes, 
lo que supone la misma proporción de 0,5 entre los target y los competidores, y, 
por tanto, el rendimiento es igual. Sin embargo, cuando se produce un cambio en 
la demora de 5 a 15 segundos, los sujetos tienen que discriminar el ítem target de 
15 segundos de los ítems competidores presentados 20 segundos antes, lo que 
dificulta la discriminación a 0,75, mientras que el cambio de 25 a 15 segundos 
supone una ratio más fácil de 15:40 entre el target y los competidores. 


Sin embargo, el área en la que más se ha usado la razón de discriminación es en 
el recuerdo libre, en el que se presenta una secuencia de ítems y se pide al sujeto 
que recuerde tantas como le sea posible en cualquier orden. Cuando el recuerdo 
es inmediato, hay una clara tendencia de los últimos ítems presentados a mostrar 
una mayor cantidad de recuerdo, lo que se conoce como efecto de recencia. El 
efecto no depende de una estrategia explícita durante el aprendizaje, ya que se 
encontró que es igualmente prominente bajo aprendizaje incidental, cuando el 
sujeto no espera que le pidan recuerdo (Baddeley y Hitch, 1977; pinto y 
Baddeley, 1991). 


La idea de que nuestra capacidad para discriminar entre nuestras memorias 
disminuye a medida que aumenta la demora se remonta por lo menos al 
psicólogo británico James Sully (1982), pero fue Crowder quien nos convenció: 


Los ítems de una lista de recuerdo presentada a una tasa constante pasan de largo 
con la misma regularidad con la que pasan los postes de teléfono cuando 
viajamos en tren. De la misma manera que un poste de teléfono visto a lo lejos 
se va distinguiendo cada vez menos del poste vecino, cada ítem en la memoria se 
va distinguiendo menos a medida que los episodios de presentación se van 
quedando en el pasado. 


(Crowder, 1976, p. 462) 


Numerosos investigadores han proporcionado pruebas que apoyaban la regla de 
la ratio constante en el recuerdo libre, mediante estudios que van desde tareas de 
laboratorio que ponen a prueba el recuerdo de material verbal a lo largo de 


intervalos de tiempo de unos segundos hasta la memoria de sucesos del mundo 
real como partidos de rugby, que se ponen a prueba después de demoras por 
encima de unas cuantas semanas (Baddeley y Hitch, 1977). 


Mientras que el efecto de recencia estándar en el recuerdo libre se puede 
eliminar contando simplemente durante cinco segundos (Glanzer, 1972), se 
pueden encontrar efectos de recencia mucho más robustos bajo circunstancias 
apropiadas. por ejemplo, Bjork y Whitten (1974) pidieron a sus sujetos que 
recordaran listas de palabras sin ninguna relación entre ellas. para eliminar 
cualquier contribución de la memoria a corto plazo o primaria, cada palabra fue 
precedida y seguida de tareas aritméticas; de manera semejante, entre el final de 
la lista y el recuerdo libre se intercaló una demora rellena aritméticamente. a 
pesar de esta demora rellena, se encontró un marcado efecto de recencia. Es más, 
después de haber realizado unas cuantas listas como estas, los experimentadores 
pidieron a los sujetos que de todas las listas recordaran tantos ítems como les 
fuera posible. El efecto de recencia previamente observado dentro de cada lista 
desapareció en este último recuerdo libre, aunque las últimas listas tuvieron 
ventaja, una ventaja que desapareció cuando se volvió a pedir recuerdo al día 
siguiente. Bjork y Whitten interpretaron que la ventaja que proporciona la 
recencia se debía al uso de una estrategia de recuperación basada en la recencia, 
y no a una diferencia en el grado de codificación de las palabras dentro de las 
listas. Este resultado se vio apoyado por la ausencia de recencia en un estudio 
posterior en el que el recuerdo se reemplazó por reconocimiento, un 
procedimiento que se suponía que facilitaba la fase de recuperación, y con un 
control del orden de presentación, para impedir la utilización de una estrategia 
basada en la recencia. 


Glenberg et al. (1980) dieron pruebas de la existencia de la regla de la ratio 
constante en un amplio rango de intervalos de recuerdo bajo condiciones de 
laboratorio, mientras que Baddeley y Hitch (1977) demostraron un efecto de 
recencia que se extendía más allá de unas cuantas semanas, cuando les 
preguntaron a un grupo de jugadores de rugby contra qué equipos rivales habían 
jugado. tal como hubiera predicho la hipótesis de la razón de discriminación, la 
función reflejaba el número de partidos interpolados más que la cantidad de 
tiempo que había transcurrido. 


Evidencias cuantitativas más directas sobre la hipótesis de la razón de 
discriminación provienen de otro estudio de la vida real en el que pinto y 
Baddeley (1991) pusieron a prueba la capacidad de sus colegas de la unidad de 


psicología aplicada de Cambridge para recordar dónde habían aparcado su coche 
a lo largo de un período de dos semanas. Bajo estas condiciones se dio un claro 
efecto de recencia. Sin embargo, los sujetos experimentales que habían visitado 
la unidad solo en una ocasión recordaban dónde habían aparcado igual de bien, 
tanto si la visita se había producido dos horas antes (72 por ciento), como si se 
había producido una semana antes (73 por ciento) o un mes antes (72 por 
ciento). Sin embargo, había una diferencia entre los grupos. Como no había 
marcas en el suelo del aparcamiento, solo se permitía a los sujetos que indicaran 
una plaza en el dibujo del mapa, o, si dudaban, que eligieran dos plazas 
contiguas. De hecho, muy pocas personas aparcaban en más de una plaza, pero 
el número de personas que elegían la opción menos precisa aumentaba desde un 
14 por ciento a las dos horas hasta un 30 por ciento después de una semana, y un 
60 por ciento después de un mes, lo que sugería que algo estaba cambiando, 
aunque posiblemente solo fuera el grado de confianza. 


En un último experimento, los grupos de sujetos venían al laboratorio dos veces, 
separadas entre sí por un intervalo de unas dos semanas. Después se les 
examinaba enviándoles dos sobres, con instrucciones estrictas sobre cuál abrir 
primero. El primer sobre les preguntaba específicamente dónde habían aparcado 
cuatro semanas antes. para la mitad de los sujetos (el grupo de la Interferencia 
proactiva o grupo Ip) esta era su segunda visita, mientras que para el otro grupo 
(el grupo de la Interferencia Retroactiva o grupo IR) este recuerdo se refería a su 
primera visita. los resultados indicaron que esta segunda visita suponía un 
descenso en el recuerdo desde el 72 por ciento que recordaban los sujetos del 
experimento previo, que solo habían hecho una visita, hasta un 47 por ciento que 
recordó el grupo Ip, y un significativamente pobre 39 por ciento del grupo IR. 
Como hubiera predicho la hipótesis de la razón de discriminación, tener dos 
sucesos en competición reduce el rendimiento general. El segundo sobre ponía a 
prueba su recuerdo sobre la visita anterior. El grupo IR, para el que la visita 
había tenido lugar dos semanas antes, recordaba correctamente un 61 por ciento, 
significativamente más que el recuerdo del grupo Ip, cuya anterior visita había 
tenido lugar seis semanas antes (un 20 por ciento). Finalmente, el gráfico con los 
porcentajes de recuerdo para cada una de estas condiciones mostró que los 
resultados confirmaban la regla de la ratio constante. En conclusión, el estudio 
demostró que, primero, el grado de olvido de un único suceso se eleva 
relativamente poco a lo largo del tiempo per se, mientras que cuando se tienen 
que recordar dos sucesos el recuerdo pasa de un 60 por ciento después dos 
semanas hasta un 40 por ciento después de cuatro, y un 20 por ciento después de 
seis semanas. 


6.3. Teorías del efecto de recencia 


6.3.1. Contexto y recencia 


Si admitimos provisionalmente que la regla de la ratio constante es un fenómeno 
general dentro de la memoria, tal como afirman Glenberg et al. (1980), Nairne 
(2002) y Brown et al. (sin publicar), ¿cómo podríamos explicarlo? Glenberg et 
al. (1980) sugieren que cada ítem se codifica en contraste con un fondo 
contextual en constante cambio, que a su debido tiempo sirve como un indicio de 
recuerdo. Ellos sugieren que cuanto más tiempo pasa, mayor es la cantidad de 
cambio, por tanto, habrá pocos indicios en común entre el contexto de 
codificación y el de recuperación, y el recuerdo será pobre. Desafortunadamente, 
no proporcionan evidencias empíricas que apoyen este supuesto contextual. De 
hecho, el propio estudio proporciona pruebas en contra. En su primer 
experimento se modifica la dificultad de la tarea aritmética, bien dejándola igual 
durante la presentación y durante el período inmediatamente anterior al 
recuerdo, o bien se cambia la duración entre la presentación y el pretest. Sin 
embargo, este cambio en el nivel de dificultad, y por tanto entre el contexto de 
aprendizaje y el de recuerdo, no tuvo efectos. parece entonces que dentro del 
modelo de Glenberg el contexto no se distingue a medida que transcurre el 
tiempo. Dada las veces que McGeoch mencionó rechazar la teoría del 
decaimiento sobre la base de que el tiempo per se puede que no tenga efectos 
(Nairne, 2002), es comprensible que Glenberg et al. quieran revestirlo de una 
forma más respetable. otros como Nairne (2002) —que cita el dictamen de 
McGeoch con aprobación-— y Bjork (2002) enfatizan la importancia de la razón 
temporal de discriminación, y por tanto implícitamente también la importancia 
del tiempo, pero la cuestión de cómo el tiempo podría servir como indicio no se 
toca directamente. 


6.3.2. Desvanecimiento de la huella 


Otra posible explicación es la hipótesis del desvanecimiento de la Mlp, como la 
que sugiere Baddeley (1976, pp. 95-99). Esta hipótesis proponía que la 
recuperación incluía dos etapas, primero acceder al cluster general de las huellas 
de memoria, y luego discriminar entre ellas. Este último proceso está 
determinado probablemente por una serie de factores, entre los que se incluye el 
grado de aprendizaje y la similitud entre la huella deseada y las posibles 
competidoras. además, todas las huellas podrían ser susceptibles de un 
desvanecimiento, el cual, en aras de la paz y armonía con los restos de 
McGeoch, podría ser reetiquetado como una «interferencia general». Esta 
interferencia no específica podría ser posible resultado del hecho de que el 
sistema nervioso está en constante actividad y cambio, y, por tanto, podría añadir 
un ruido potencial a la huella de memoria; cuanto mayor fuera la demora, mayor 
sería el ruido. 


Claramente, esta propuesta requeriría una definición mucho más precisa dentro 
del marco de trabajo de la teoría de la interferencia general. Sería necesario 
realizar algún supuesto sobre estos temas básicos, como por ejemplo si 
funcionaría la simple hipótesis de las respuestas en competición, o lo que parece 
más probable, si se necesita asumir algún tipo de olvido de lo aprendido, en el 
que los procesos de aprendizaje y olvido de lo aprendido reflejaran variables 
temporales, como proponen por ejemplo anderson y Bjork (1994). El modelo 
también requeriría algún supuesto que considerara la relativa contribución de la 
interferencia general y de la interferencia específica del ítem. En resumen, 
requeriría una teoría del olvido bien trabajada, un tema importante que en los 
últimos años ha recibido menos atención de la que se merece, aunque 
afortunadamente hay signos de que esto está empezando a cambiar (anderson et 
al. , 2000; Rubin y Wenzel, 1996). 


6.3.3. Memoria de trabajo y recencia 


¿Cuáles son entonces las implicaciones de la hipótesis de la razón de 
discriminación, y de las teorías del olvido en general, para el concepto de la 
memoria de trabajo? la sugerencia que hacen Nairne (2002), Ward (2001) y 
Brown et al. (sin publicar) es que la presencia de principios comunes a lo largo 
de distintos tipos de memoria implica que no es necesario suponer que los 


sistemas de memoria sean diferentes. Sin embargo, aunque la presencia de 
principios comunes a lo largo de los sistemas puede ser necesaria para alegar una 
identidad, seguramente no sea suficiente. por el contrario, tras el hecho de que la 
ley de Weber se aplica a la visión, el oído y el olfato, uno podría concluir que 
estos sentidos conforman un único sistema unitario. todos los sistemas de 
memoria necesitan resolver los problemas de codificación, almacenamiento y 
recuperación. El hecho de que se puedan dar soluciones análogas a estos 
problemas a lo largo de sistemas diferentes es de considerable interés, pero, a 
menos que los sistemas sean equivalentes en el resto de los aspectos, estos 
descubrimientos no implicarían una simple unidad. Dada la gran variedad de 
evidencias discutidas anteriormente, desde estudios psicológicos, 
neuropsicológicos y de neuroimagen, regresar al planteamiento de los años 1950 
sobre la existencia de un solo sistema unitario sería seguramente un inmenso 
paso atrás. pero en ese caso, ¿cómo podríamos explicar la presencia de los 
principios tan similares que determinan los efectos de recencia en la memoria a 
largo y corto plazo? 


Baddeley y Hitch (1974) estudiaron el recuerdo libre inmediato de listas de 
palabras sin relación entre ellas, bajo condiciones de control, o con una segunda 
tarea concurrente consistente en escuchar repetidamente y recordar secuencias 
aleatorias de seis dígitos. la carga en memoria de la tarea concurrente deterioró 
el rendimiento de las palabras a lo largo de las posiciones seriales anteriores, lo 
que suponemos que refleja la Mlp; sin embargo, no influyó sobre el efecto de 
recencia. Concluimos que la recencia no dependía del sistema del bucle 
fonológico, el cual estaría completamente ocupado con la tarea concurrente de 
los dígitos. por otro lado, pacientes gravemente amnésicos parecían mostrar un 
efecto de recencia normal en el recuerdo libre inmediato de listas de palabras 
(Baddeley y Warrington, 1970), lo que sugiere que la recencia en el recuerdo 
libre no se puede atribuir de una manera sencilla a la Mlp. Más aún, Shallice y 
Warrington (1970) mostraron que la recencia está gravemente deteriorada en 
pacientes con una deficiencia fonológica en la MCp. ¿podría ser que estos 
pacientes fueran simplemente incapaces de usar una estrategia de recencia? 
Vallar et al. (1991) pusieron a prueba esta posibilidad estudiando el efecto de 
recencia en un paciente p.V., con un déficit muy puro en la MCp fonológica. 
usamos dos tareas de recuerdo libre, una consistía en el recuerdo inmediato 
estándar de una lista de palabras, que sabemos que produce un efecto de recencia 
que se puede eliminar interpolando una actividad durante unos segundos 
(Glanzer, 1972). tal como esperábamos, incluso sin incluir una tarea de relleno, 
p.V. mostró escasas evidencias del efecto de recencia. la segunda tarea consistía 


en intentar resolver sencillos anagramas, y luego, sin avisarla, tenía que recordar 
la solución a los anagramas, una tarea que sabemos que da lugar a un efecto de 
recencia muy robusto [Baddeley (1963)]. Bajo estas condiciones, p.V. mostró un 
efecto de recencia a largo plazo normal. 


¿Cómo explicar estos resultados? Baddeley y Hitch (1977; 1993) propusieron lo 
siguiente. Cuando se codifica un ítem o una situación, aquellas representaciones 
implicadas en el proceso se activarán automáticamente, dando lugar a una 
facilitación de esa representación, haciendo que posteriormente sea más fácil 
reactivarla. la capacidad de activación total disponible dentro de una categoría es 
limitada, por tanto, la presentación y facilitación de cada nuevo ítem reducirá el 
nivel de activación de los ítems que anteriormente estaban facilitados dentro de 
la categoría relevante. El efecto de recencia resulta entonces de una estrategia de 
recuperación que se centra en el hecho de que los ítems facilitados previamente 
serán más fácilmente accesibles. una analogía muy simple es comparar la 
representación interna de cada ítem con una bombilla de luz eléctrica, y a la 
activación, compararla con la iluminación de la bombilla. una vez que se ha 
iluminado, retendrá el calor, lo que hará que esa bombilla sea algo más fácil de 
iluminar la próxima vez. Sin embargo, con cada nueva bombilla que se vaya 
iluminando, se irá consumiendo algo de ese calor. El proceso de recuperación 
sería algo análogo a incrementar gradualmente la cantidad de corriente eléctrica 
al banco de bombillas encendidas, consiguiendo que las más recientes sean 
iluminadas antes. Este proceso de recuperación, de forma análoga a un 
incremento de la corriente, dependería de la capacidad de aislar de forma 
correcta y diferenciada el banco de bombillas. Debe subrayarse que la sencilla 
analogía de las bombillas de luz solo intenta proporcionar una pincelada de un 
tipo de modelo. por ejemplo, dado que el efecto de recencia se puede extender a 
varios meses, se requiere claramente algo más que una simple analogía de calor 
basada en el tiempo. 


6.3.4. La hipótesis SIMPLE 


Un candidato posible es el modelo SIMPLE (Escala Invariante de Memoria, 
percepción y aprendizaje)* obra de Hulme et al. (2004) presentado en un artículo 
de Brown, Neath y Chater. Este es un modelo general altamente ambicioso, que 


acentúa la discriminación como el principal determinante del recuerdo, que 
enfatiza la discriminación temporal como algo particularmente importante para 
el recuerdo serial (Hulme et al. , 2004, p. 103). El tiempo tiene la ventaja 
metodológica de ser una dimensión en la que la semejanza de los ítems a 
recordar se puede especificar objetivamente. Sin embargo, como 
mencionábamos en el Capítulo 3, este modelo tiene dificultades para dar cuenta 
de los datos espacio-temporales en el recuerdo verbal serial inmediato 
(lewandowsky et al. , en prensa; Nimmo y lewandowsky, en prensa a, b). 


La ubicuidad de la regla de la ratio constante sugiere que probablemente 
SIMPLE haga un trabajo mejor en el recuerdo libre. Sin embargo, lo más que 
puedo decir es que SIMPLE parece ser un modelo más bien complejo, que 
incluye un número no especificado de dimensiones estimulares con pesos 
variables, con el peligro de que se convierta en una forma de ajuste a la curva 
pero a posteriori, y no en una herramienta conceptual fructífera para incrementar 
nuestro conocimiento. El tiempo lo dirá. 


Sin embargo, suponed que volvemos a nuestro modelo verbal básico e 
intentamos aplicarlo a los distintos fenómenos de recencia; ¿cómo funcionará de 
bien? asumimos que el proceso de preparación [priming]* es automático, y, a 
diferencia de la MLP, no está reducido por la imposición de una tarea secundaria 
que demande atención, como, por ejemplo, la tarea concurrente de amplitud de 
dígitos; por tanto, se preserva la recencia en el experimento del recuerdo libre de 
Baddeley y Hitch (1974). El priming puede funcionar en una serie de niveles 
representacionales diferentes, incluyendo el fonológico, por tanto, esto da lugar a 
que en los pacientes con amnesia la recencia esté preservada en el recuerdo libre 
verbal inmediato (Baddeley y Warrington, 1970) y esté ausente en pacientes con 
un déficit en la MCP (Shallice y Warrington, 1970). Por eso, tal como 
esperábamos, P.V. no mostró un efecto de recencia en la clásica condición de 
recuerdo libre inmediato, ya que este efecto depende típicamente de un sistema 
léxico fonológicamene activado. puesto que su almacén fonológico está 
deteriorado, este sistema no tiende a usarse. por otro lado, dado que la 
codificación semántica a largo plazo es normal, puede mostrar una preparación 
normal y, por tanto, una recencia a largo plazo no deteriorada. 


6.3.5. Múltiples efectos de recencia concurrentes 


Por supuesto, esto significa que uno puede tener una gran serie de efectos de 
recencia simultáneos que reflejen diferentes aspectos de la memoria a largo 
plazo. Por ejemplo, probablemente, la última fiesta a la que fuiste y la última vez 
que fuiste al cine o viajaste al extranjero son todos ellos sucesos bastantes 
accesibles, mientras que el penúltimo ítem o los anteriores no lo son. Watkins y 
peynircioglou (1983) estudiaron esta posibilidad, presentando a sus sujetos 
tareas seleccionadas a partir de áreas conceptuales claramente diferentes, por 
ejemplo, resolviendo adivinanzas, realizando acciones sencillas o mencionando 
cuáles son tus elementos favoritos dentro de categorías específicas, como la 
comida, o la categoría de los cantantes. por tanto, se le puede preguntar a un 
sujeto por su comida preferida, después, que resuelva adivinanzas, y luego, que 
realice acciones específicas. Después, de las tres tareas se les pide que recuerden 
todos los ítems que puedan en cualquier orden. Esto da lugar a tres efectos de 
recencia simultáneos y aparentemente equivalentes, el de las adivinanzas, las 
acciones y los favoritos. Sin embargo, es importante apuntar que identificar áreas 
suficientemente separadas no fue una tarea sencilla. por ejemplo, intercalar 
categorías semánticas como animales, colores y flores da lugar a un solo efecto 
de recencia. Esto contrasta con la acumulación y la liberación de la Ip en la tarea 
del olvido a corto plazo de peterson, en la que el paso de animales a colores, por 
ejemplo, produce una liberación completa de la interferencia previa. Es 
probable, por tanto, que la recencia y la tarea de peterson tengan bases algo 
diferentes. Volveremos sobre esto más tarde. 


En este punto necesitamos ampliar la analogía de los postes de teléfono de 
Crowder, al menos para incluir más de una vía de tren. Quizá una analogía mejor 
sea sugerir que el intento de recuperar experiencias implica establecer indicios 
de recuperación que evoquen ejemplos apropiados, como indicios de visitas al 
teatro O viajes al extranjero. Cada uno de estos conjuntos de indicios producirá 
una serie de sucesos potencialmente recuperables y diferentes unos de otros. una 
analogía alternativa es el agrupamiento de edificios que conforman las granjas, 
las aldeas y los pueblos, esparcidos a lo largo de una llanura. una tarea como la 
de recuerdo libre esencialmente implica identificar e informar todos los edificios 
posibles. los edificios más cercanos al observador tendrán un acceso más fácil y 
se identificarán mejor. Cuando sea necesario intentar identificar y nombrar un 
edificio concreto que esté alejado, el éxito dependerá, en primer lugar, de que se 
logre identificar el grupo correcto y, en segundo lugar, de que se pueda 
discriminar ese edificio de los edificios vecinos, con los que potencialmente se 


pueda confundir. El efecto de recencia refleja la accesibilidad relativa en función 
de los edificios competidores, mientras que la regla de la ratio constante refleja 
el proceso de diferenciación de los edificios-objetivo en competición. El 
resultado de Watkins y peynircioglou (1983) sugiere que si el objetivo relevante 
se diferencia claramente, entonces no interferirán mutuamente unos con otros. 


No es necesario decir que un modelo como este requiere una especificación 
adecuada que incluya no solo las reglas de decisión, sino también cómo se 
representa el tiempo, y la cuestión de si la interferencia se da como un simple 
resultado de la competencia entre ítems o implica algún proceso adicional 
inhibitorio o de olvido de lo aprendido (anderson y Bjork, 1994). la cuestión de 
qué es lo que constituye un área de recuperación separable y distintiva es 
también una cuestión importante, ya que aún no parece haber sido explorada. por 
ello, aunque muchos teóricos están de acuerdo en la importancia y 
generalización de la regla de la ratio constante, esta solo representa un primer 
paso hacia lo que debería ser una teoría mucho más elaborada. 


6.3.6. Recencia y repaso 


Antes de terminar, deberíamos considerar el ambicioso intento de Ward (2001) 
de fundamentar toda una teoría sobre la memoria de trabajo en la recencia. Él 
describe una serie de experimentos usando la técnica ideada por Rundus (1971) 
para estudiar el papel del repaso verbal memorístico en el recuerdo libre. Se 
presenta a los sujetos una lista de palabras sin conexión entre ellas, y se les pide 
que las repasen en alto a medida que van apareciendo, después de lo cual les 
piden el recuerdo libre. El rendimiento se plasma en función del número de 
repasos que se lleva a cabo en voz alta con cada ítem y su recencia. Combinando 
estas medidas se da buena cuenta de los efectos de primacía y de recencia (tam y 
Ward, 2000). Ward propone un modelo unitario de Memoria Episódica General 
(MEG), el cual, según él, proporciona una buena explicación general de los 
datos de memoria, tanto a largo como a corto plazo. 


Coincido en que el repaso juega a menudo un importante papel en el efecto de 
primacía, pero no estoy del todo convencido de la importancia del repaso sobre 
la gran variedad de efectos de recencia observados en el recuerdo libre. El 


informe que Ward (2001) proporciona se basa en la correlación que observa 
entre el número de repasos y la probabilidad de recuerdo. Esto podría reflejar o 
bien la influencia del repaso en el recuerdo posterior, tal como él mismo sugiere, 
o bien la tendencia de los ítems que por alguna razón son más fácilmente 
recuperables a ser seleccionados para el repaso. la facilidad de recuperación y la 
frecuencia de repaso se pueden confundir potencialmente, lo que hace que la 
correlación sea difícil de interpretar sin equívocos. El hecho de que el método de 
Rundus adoptado por Ward obligue a usar una estrategia de repaso memorístico, 
también suscita el problema de la generalización de estos resultados, ya que la 
estrategia preferida de la mayoría de los sujetos en el recuerdo libre es confiar en 
la codificación semántica más que en la fonológica (Kintsch y Bushke, 1969; 
tulving, 1962). 


Finalmente, la interpretación en términos del repaso tiene dificultades para dar 
cuenta del hecho de que los efectos de recencia predominan en las condiciones 
de aprendizaje incidental, en las que el sujeto no tiene razones para repasar. por 
ejemplo, Baddeley y Hitch (1977) pidieron a sus sujetos que clasificaran unos 
nombres como pertenecientes a niños, niñas o a ambos. un grupo estaba avisado 
de que posteriormente tendrían que recordar los nombres, mientras el segundo 
grupo no. ambos mostraron un efecto de recencia equivalente. De manera 
semejante, en el caso de nuestro estudio sobre la recencia a largo plazo en el 
recuerdo de las plazas de aparcamiento (pinto y Baddeley, 1991), no hay razón 
para suponer que los sujetos que habían llegado a la unidad de psicología 
aplicada para ser examinados tuvieran necesidad de seguir repasando la plaza en 
la que habían aparcado después de unos días o unas semanas. 


Por tanto, aunque Ward (2001) y yo estamos de acuerdo en la importancia del 
efecto de recencia y del papel de la discriminación en la recuperación, no 
estamos de acuerdo en el valor de la técnica de repaso en voz alta de Rundus, ni 
en la generalización de las conclusiones basadas en simples medidas de repaso 
memorístico. 


6.4. La función evolucionista de la recencia 


Dado el amplio alcance de la regla de la ratio constante, es obvia su importancia 


teórica, pero, ¿tiene alguna importancia práctica? Sugiero que sí, por dos 
razones. En primer lugar, las estadísticas de los sucesos sobre el mundo no son 
aleatorias, sino que se agrupan. Si nos encontramos con una oveja, es más 
probable que nos encontremos con otra, antes de encontrarnos con una cebra o 
un pingúino, al igual que en un periódico las noticias sobre fútbol tienden a 
agruparse juntas, de igual forma que las noticias sobre las vacaciones o las de 
una eminente figura como el papa. Es por tanto razonable tener un sistema 
sesgado que espere algo que haya ocurrido recientemente, es decir, un sistema 
sesgado hacia la facilitación. Esta facilitación, sin embargo, es con mucha 
probabilidad enteramente pasiva, mientras que el efecto de recencia se basa en 
una estrategia activa que se puede usar o se puede ignorar. ¿para qué otra cosa 
puede ser de utilidad esta estrategia además de ayudar a los sujetos en 
experimentos psicológicos? 


En la vida moderna, como hemos visto antes, recordar dónde has aparcado tu 
coche parece beneficiarse de la recencia, lo mismo que recordar la habitación en 
la que te alojas cuando estás de viaje; no es de mucha ayuda saber que la semana 
pasada estuviste en la habitación 236, 119, 501 y 402, a menos que tengas claro 
cuál fue la última. Más importante, cuando te despiertas a la mañana siguiente en 
la habitación de un hotel, en una ciudad que nunca has visitado, ¿cómo sabes 
dónde estás? En todos estos casos yo creo que se usa una estrategia de recencia, 
probablemente empezando por recordar la mañana previa y usando esto para 
construir el patrón de tus actividades a lo largo de los últimos días. Esto a su vez 
puede ajustarse a un conjunto anidado de marcos de trabajo, que se extienden a 
toda una serie de niveles, tanto específicos, como la razón de tu viaje, como más 
generales, como tu carrera, tu familia y, de hecho, a toda la historia de tu vida. 


Parece que también contamos con expectativas sobre qué es lo más probable que 
ocurra después. En el ejemplo del hotel, anticiparemos las actividades 
relacionadas con despertarse, encontrar el desayuno, localizar la reunión y 
asegurarte de que después coges tu avión, todo refleja una planificación que casi 
con toda seguridad está guiada en parte por la recuperación basada en la recencia 
a largo plazo. Es como si nos rodeara un conjunto anidado de marcos de trabajo. 
todo está basado en experiencias pasadas, algunas episódicas, como dónde 
estuvimos la noche pasada, y otras semánticas, como nuestro conocimiento sobre 
cómo funcionan los hoteles. Si disponemos de una memoria semántica y 
episódica normales, entonces podemos utilizarlas para guiar nuestras acciones 
inmediatas y planificar el futuro. Este proceso implica casi por completo tanto a 
la memoria de trabajo como a la MIp, y refleja una capacidad que está 


típicamente deteriorada en pacientes disejecutivos con daños en el lóbulo frontal 
(ver Capítulos 7 y 8). 


Sin embargo, una memoria de trabajo preservada no es suficiente. los pacientes 
con amnesia con una buena capacidad de memoria de trabajo, pero sin una 
memoria episódica adecuada, son incapaces de construir una estructura continua 
que represente sus vidas. 


Un pariente mío profundamente amnésico, por ejemplo, que había vivido en la 
misma habitación y en la misma residencia durante un año, seguía preguntando 
dónde se encontraba cuando volvía a su habitación y, como es normal en todos 
los pacientes amnésicos, no tenía ni idea de lo que había estado haciendo apenas 
unos minutos antes. Tulving (2002) sugiere que la memoria episódica 
proporciona los medios para conseguir «un viaje mental en el tiempo», 
permitiendo que regresemos al pasado y recolectemos experiencias pasadas y las 
usemos para elaborar planes y expectativas de futuro. Yo sugiero que el efecto de 
recencia es lo que nos permite orientarnos en el tiempo y en el espacio, y así nos 
proporciona el pilar sobre el que se puede apoyar nuestro lugar en el presente y 
nuestra proyección al futuro. Sin el mecanismo de recencia, sugiero que 
tendríamos grandes dificultades para situarnos en el tiempo, y una vez fuera de 
nuestra rutina normal, en el espacio. Si no sabemos dónde estamos ahora, 
tenemos pocas posibilidades de saber dónde estaremos en el futuro, y, por tanto, 
estamos condenados a vivir en el presente, como ilustró el trágico caso de Clive 
Wearing, un músico talentoso que se volvió profundamente amnésico tras una 
infección cerebral que le dejó incapaz de recordar más allá de unos pocos 
segundos, encerrado en el presente con escasa memoria del pasado y sin 
capacidad para anticipar el futuro (Wilson et al. ). 


En conclusión, no hay duda de que el efecto de recencia es uno de los más 
estables y fiables fenómenos dentro del estudio de la memoria humana. también 
existe un amplio consenso que apoya la regla de la ratio constante. Sin embargo, 
hay mucho menos acuerdo sobre su interpretación; algunos teóricos como 
Nairne (2002) la ven como prueba de un sistema de memoria unitario. otros, 
entre los que me incluyo, lo ven como un mecanismo que puede funcionar a lo 
largo de una serie de almacenes de memoria distintos, reflejando uno de una 
serie de principios generales, pero sin implicar en sí mismo un sistema unitario. 
De hecho, yo consideraría el efecto de recencia como un efecto que típicamente 
implica dos tipos de memoria; un efecto de preparación implícito y una 
estrategia de recuperación explícita. Este priming puede ocurrir en cualquier 


serie de sistemas de memoria, desde un almacén ecoico cuasi-sensorial muy 
breve (Glucksberg y Cowan, 1970) hasta una memoria tanto episódica como 
semántica (Watkins y peynircioglu, 1983). la selección y el funcionamiento de la 
estrategia dependerán del ejecutivo central, el componente de la memoria de 
trabajo que consideraremos a continuación. 


Notas al pie 


* En Inglés el acrónimo SIMplE se corresponde con « Scale Invariant Memory, 
Perception and Learning». N. de la T. 


* «preparación [priming] es un término utilizado para referirse a la influencia 


gue tiene un estímulo en el rendimiento subsiguiente del sistema de 
procesamiento» (Baddeley, 1999). El efecto puede ser facilitador (preparación 
positiva o priming positivo), pero también puede ser inhibitorio, preparación 
negativa o priming negativo. N. de la T. 


CAPÍTULO 7 


Eraccionando el ejecutivo central 


No hay duda de que el componente denominado ejecutivo central es el 
subsistema más importante del modelo de memoria de trabajo de tres 
componentes. Mi primer intento de analizar el ejecutivo (Baddeley, 1986) 
consistió en un solo capítulo bastante provisional. Mi intento actual constituye al 
menos la mitad del presente libro. Estaría bien decir que esto es así porque ahora 
entendemos cómo funciona el ejecutivo central. Triste, pero no 
sorprendentemente, este no es el caso. Sin embargo, se han hecho considerables 
progresos en una gran serie de áreas, dirigidos a comprender el ejecutivo central. 
No obstante, lograr cubrir tan solo una fracción de esta cuestión supondría un 
gran trabajo que va más allá de mi modesta contribución al tema. De particular 
relevancia para el concepto del ejecutivo central de capacidad limitada, es la idea 
de Cowan (2005) de un foco de atención de capacidad limitada capaz de 
mantener cerca de cuatro segmentos de información, una perspectiva que ambos 
consideramos enteramente compatible con el modelo multicomponente de la 
memoria de trabajo. Aunque Cowan y yo estamos ampliamente de acuerdo en lo 
fundamental, discrepamos en el énfasis. Quizá por razones históricas, yo me he 
volcado en el almacenamiento a corto plazo, y me he visto influido por 
evidencias neuropsicológicas, mientras que Cowan acentúa el papel del foco de 
atención y de las aproximaciones evolutivas. Recomiendo su excelente libro 
(Cowan, 2005), pues proporciona una explicación del papel de la capacidad 
atencional en la memoria de trabajo mucho más completa que la que se presenta 
aquí. El trabajo de Shallice (Shallice, 2002; Shallice y Burguess, 1996) también 
es ampliamente compatible, aunque realiza un fraccionamiento mucho más 
detallado que el mío, y confía más fuertemente en los enfoques 
neuropsicológicos, de neuroimagen y en los computacionales. Finalmente, existe 
una gran y creciente literatura neurobiológica sobre el control ejecutivo, 
debidamente representada en los Principios del funcionamiento del lóbulo 
frontal de Stuss y Knight (2002) . 


Sin embargo, los próximos tres capítulos tienen el objetivo mucho más modesto 
de describir mis propios intentos por remarcar el concepto del ejecutivo central. 
Los intentos se basan en un enfoque (Baddeley, 1996), que identifica cuatro 
candidatos como componentes importantes del proceso ejecutivo, a saber, la 
capacidad para centrar la atención, dividir la atención, desplazar la atención y 
proporcionar una unión entre la memoria de trabajo y la memoria a largo plazo. 
Los tres primeros se cubrirán en el presente capítulo y el cuarto en los Capítulos 
8 y 9. Antes de empezar con esta investigación, resumiré algunas evidencias de 
fondo sobre la idea básica del ejecutivo central. 


Anteriormente ya me declaré culpable de crear un ejecutivo que es virtualmente 
un hombrecillo, un pequeño señor que está en la cabeza, y que toma todas las 
decisiones importantes pero difíciles. 


Lo justifico de la misma manera que Attneave (1960). Siempre y cuando 
intentemos describir las funciones realizadas por nuestro hombrecillo, podremos 
establecer una política de divisiones y reglas, intentando de manera sistemática 
proporcionar una explicación plausible sobre cómo podrían llevarse a cabo cada 
uno de estos procesos. Uno espera que esta estrategia de hacer a nuestro 
hombrecillo cada vez más redundante termine permitiéndonos prescindir de él 
completamente. Ciertamente, por el momento no estamos en posición de hacer 
esto. Sin embargo, creo que cada vez está más claro cómo podríamos 
conseguirlo. Por tanto, los capítulos que vienen a continuación se podrían ver 
como un intento de jubilación de nuestro hombrecillo. 


7.1. El ejecutivo central como un cajón de sastre 


Durante al menos la primera década tras el artículo de Baddeley y Hitch (1974) 
nos concentramos principalmente en los subsistemas fonológicos y 
visoespaciales simplemente porque parecían ofrecer retos mucho más asequibles 
que los del ejecutivo. Aunque no era una estrategia particularmente Osada, yo 
diría que funcionaba razonablemente bien a corto plazo. Sin embargo, como se 
reconoce en Baddeley (1986), las continuas referencias a los problemas del 
ejecutivo, sin ninguna especulación posible sobre cómo tratarlas, se estaban 
volviendo embarazosas. Esto me llevó a adoptar el modelo de sistema atencional 


supervisor (SAS) de Norman y Shallice (1986) como un posible marco de 
trabajo para el ejecutivo. Sin embargo, a menos que este marco de trabajo se use 
constructivamente dentro del modelo de MT, se puede seguir argumentando que 
cualquier llamamiento al concepto del ejecutivo central no hace más que 
subrayar que el fenómeno en cuestión probablemente dependa de algún tipo de 
sistema de control atencionalmente limitado y relativamente flexible. La 
ausencia de un modelo claramente formulado para el ejecutivo tiene el peligro de 
que otros se inventen la estructura, y la etiqueten como una estructura para el 
ejecutivo central, y después sigan argumentando acerca de su plausibilidad. El 
estatus monolítico que se le supone al ejecutivo es un ejemplo común, a pesar 
del hecho de que «Parece poco probable que el ejecutivo central demuestre ser 
un simple sistema unitario» (Baddeley, 1986, p. 253). Kimberg et al. declaran 
que «por definición el ejecutivo central es unitario», posiblemente sobre la base 
de que la palabra ejecutivo está en singular. Una línea similar de razonamiento 
nos llevaría a concluir que el término gobierno, por estar en singular, implica por 
definición una dictadura. Un enfoque similar al de Kimberg fue adoptado por 
Parkin (1998) y rechazado por Baddeley (1998). Supongo que el ejecutivo 
central, al igual que los otros componentes de la memoria de trabajo, se puede 
fraccionar en subcomponentes. Con todo, si el modelo multicomponente va a 
seguir desarrollándose, es esencial describir la naturaleza y función del ejecutivo 
central. 


7.2. Procesos ejecutivos y los lóbulos frontales 


En los últimos años, muchas de las investigaciones llevadas a cabo sobre la 
función del ejecutivo central se han relacionado con la supuesta localización 
anatómica dentro de los lóbulos frontales. Los datos de pacientes con daños en 
los lóbulos frontales juegan un papel crucial en el desarrollo del modelo SAS 
(Shallice, 1988) y en su constitución como parte del modelo de la memoria de 
trabajo (Baddeley, 1986). La idea de que los procesos ejecutivos dependen 
críticamente de la función de los lóbulos frontales ha recibido un apoyo 
aplastante (para una revisión, ver Roberts et al. , 1998; Kane y Engle, 2002; 
Stuss y Knight, 2002). 


7.2.1. El síndrome disejecutivo 


El estudio de caso único con pacientes con un daño bilateral en los lóbulos 
frontales proporciona algunas de las evidencias más fuertes. Por ejemplo, el caso 
de R.J. (Baddeley y Wilson, 1988), que sufrió un daño bilateral sustancial en el 
lóbulo frontal cuando conducía tras un remolque de caballos. Después de estar 
inconsciente durante unos días, se recuperó gradualmente. R.J. era un ingeniero 
civil con un CI previo al accidente estimado en 120. Tanto su lenguaje como su 
amplitud de memoria visual y espacial estaban bien preservados. Tenía buenas 
habilidades sociales y un excelente sentido del humor. Su MLP estaba 
deteriorada y sujeta a amplias fabulaciones. Contó una historia totalmente falsa 
sobre su accidente, y en una prueba sobre memoria autobiográfica tuvo una serie 
de «recuerdos» muy raros. Por ejemplo, describió haber escrito a un tío suyo 
acerca de la muerte de su hermano Robin. Aunque las fabulaciones cambiaban 
día tras día, daba pruebas de creer en ellas firmemente. Por ejemplo, un fin de 
semana en su casa se volvió a su mujer y le preguntó por qué seguía diciéndole a 
la gente que estaban casados. Cuando ella le contestó que sí lo estaban, y que 
tenían algunos hijos en común, él respondió que eso no significaba 
necesariamente que estuvieran casados. Cuando le enseñaron las fotos de la 
boda, admitió que el novio se parecía a él, pero negó que realmente fuera él. Esta 
no fue una ilusión persistente, sino un único episodio de fabulación, que más 
tarde negó. 


Una característica de los pacientes con daños en el lóbulo frontal es la tendencia 
a perseverar. Cuando R.J. proporcionó un relato del accidente en el que sufrió el 
daño cerebral incluyó una larga conversación con el conductor del camión contra 
el que había colisionado, en la cual cada uno aceptaba educadamente su parte de 
responsabilidad. 


R.J.: «Lo siento, fue culpa mía.» 
Conductor del camión: «No, la culpa fue mía.» 
R.J.: «Sí, pero realmente fui yo.» 


Conductor del camión: «No. Insisto, yo tuve la culpa.» 


R.J.: «Pero definitivamente yo cometí el error», etc. 


Tras diez frases como estas, finalmente salió del bucle y continuó con el relato. 
Paradójicamente, al mismo tiempo que tienden a perseverar, también se distraen 
con facilidad, mostrando evidencias de lo que algunas veces se ha denominado 
como conducta de utilización, por la cual, en cuanto ven un objeto se ven 
incitados a usarlo, sin importar si sería socialmente apropiado; por ejemplo, 
cogen un peine que casualmente está en la estantería y lo usan, o se inclinan y 
beben de la taza de té del examinador (ver también Capítulo 17). 


El modelo de Norman y Shallice explicó este patrón de deficiencias asumiendo 
que la acción está controlada a dos niveles. La mayoría de nuestra conducta 
depende de esquemas existentes sobreaprendidos, que están fuertemente 
sometidas al control estimular. La conducta nueva o las situaciones de 
emergencia dependen de un segundo proceso, el sistema atencional supervisor 
(SAS), que normalmente es capaz de inhibir cualquier acción habitual que 
parezca dar lugar a una conducta indeseable. El SAS también es capaz de buscar 
posibles soluciones en circunstancias en las que no existe una respuesta habitual 
disponible. Más adelante en este mismo capítulo retomaremos este modelo y su 
ampliación posterior. Antes de eso, sin embargo, quizá sea mejor describir 
brevemente algunas de las explicaciones alternativas que se han presentado, a 
menudo basadas en especulaciones sobre la estructura y función de los lóbulos 
frontales. 


7.2.2, Aproximaciones neuroanatómicas 


Goldman-Rakic (1988) presentó una explicación muy influyente sobre el control 
ejecutivo en la memoria de trabajo, basándose en experimentos en los que se 
usaron únicamente células de registro para estudiar la memoria de trabajo en 
monos despiertos (Fuster y Bauer, 1974; Funahashi et al. , 1989). Identificó 
determinadas células en los lóbulos frontales que se activaban solo cuando el 
mono recordaba correctamente el lugar indexado tras una respuesta demorada. 
Encontró otras células que codificaban otros tipos de información sensorial, 
como, por ejemplo, la forma versus la situación, proponiendo un modelo de 


memoria de trabajo como un sistema para el procesamiento online de la 
información, o de la conducta, al servicio de una gran serie de funciones 
cognitivas. Ella propone que la memoria de trabajo está representada de manera 
iterativa a lo largo de una serie de subdivisiones autónomas, cada una con su 
propio sistema de control ejecutivo. Esto le permite al sistema poder integrar 
dimensiones de conducta atencionales, de memoria, motoras y muy 
posiblemente afectivas. 


Si lo extendemos a los humanos, este modelo podría estar proponiendo que el 
bucle articulatorio, por ejemplo, tiene su propio ejecutivo central. Esto 
simplemente no parece encajar ni con los datos neuropsicológicos ni con datos 
procedentes de un funcionamiento normal, ya que ambos sugieren una 
separación clara entre los procesos fonológicos y los ejecutivos, aunque por 
supuesto los dos interactúan. Sospecho que el acento que se pone en la propuesta 
de Goldman- Rakic, a diferencia de la mía, proviene del nivel de análisis, por un 
lado células de registro únicas y por otro la conducta compleja analizada a un 
nivel de sistema. 


En general, tanto las pruebas neuropsicológicas como las de neuroimagen 
parecen apoyar una organización basada en el funcionamiento más que en la 
modalidad (Tulving et al. , 1994; Owen, 1997; Smith y Jonides, 1997). La 
separación entre la modalidad de presentación y la naturaleza del procesamiento 
se ilustra de manera particularmente clara en el caso del procesamiento del 
lenguaje, en el que, por ejemplo, las letras presentadas visualmente tienden a ser 
codificadas fonológicamente (Conrad, 1964) y las secuencias habladas se pueden 
codificar visoespacialmente (Brooks, 1967; Baddeley y Lieberman, 1980). Por 
supuesto, los estudios de Goldman-Rakic con una sola unidad de registro se 
llevaron a cabo con monos cuyo bucle fonológico, si es que existe, es poco 
probable que juegue un papel importante en el rendimiento de la memoria. 


Sin embargo, no hay duda de que el trabajo de Goldman-Rakic ha tenido una 
influencia positiva sobre el estudio de la memoria de trabajo, uniendo elegantes 
estudios neuropsicológicos sobre monos con los conceptos y técnicas de la 
psicología cognitiva humana y de la neuropsicología. Se han hecho 
considerables progresos en la comprensión de las funciones de los lóbulos 
frontales a partir de estudios con animales, investigaciones neuropsicológicas y 
el trabajo con técnicas de neuroimagen (algunos excelentes ejemplos de este 
proceso se pueden ver en Roberts, Robbins y Weiskrantz [1998]). 


7.2.3. Modelos computacionales del control ejecutivo 


Un posible enfoque es continuar refinando y definiendo los modelos previos, 
combinando los datos neuropsicológicos con modelos computacionales. Un buen 
ejemplo de esto es el desarrollo continuo del modelo de Norman y Shallice 
(1983), que fue simulado computacionalmente por Cooper, Shallice y 
Farringdon (1995). Demostraron que, añadiendo «ruido» al sistema, se podía 
simular el efecto causado por un daño en los lóbulos frontales, produciendo un 
comportamiento análogo al causado por los síndromes neuropsicológicos de 
acción desorganizada y de la conducta de utilización, que aparecen en pacientes 
con un daño en los lóbulos frontales (L'Hermite, 1983). Shallice (2002) intenta 
especificar con gran detalle el posible funcionamiento del componente 
supervisor, proporcionando un modelo complejo con tres etapas principales, las 
cuales incluyen cuatro fases temporales distintas y ocho procesos diferentes. En 
el corazón del sistema está la generación e implementación de nuevos esquemas 
temporales que se corresponden fenomenológicamente con las denominadas 
estrategias. Por tanto, se corresponden con lo que Miller et al. (1960) designan 
como «planes». 


Un enfoque más amplio del modelo de Shallice (2002) se muestra en la Figura 
7.1. En este modelo la Fase 1 es responsable de la construcción de nuevos 
esquemas temporales. Sus subprocesos implican fijar objetivos, generar 
esquemas, que a su vez pueden estar influidos por la recuperación de la memoria 
episódica y por estrategias a largo plazo. La Fase 2 implica implementar nuevos 
esquemas que se mantienen en lo que se denomina como una «memoria de 
trabajo con un propósito especial». A esta fase le sigue una tercera fase en la que 
se evalúan y se verifican los nuevos esquemas, que pueden dar lugar tanto a su 
verificación y uso como a su rechazo, y por tanto a la repetición de la fase de 
generación de esquemas. 


El funcionamiento del modelo se puede ilustrar a través del rendimiento en la 
prueba de anticipación espacial de Brixton (Burgess y Shallice, 1996c), una 
prueba no verbal análoga a la tarea del “Test de Clasificación de Tarjetas de 
Wisconsin*, que es sensible a los efectos causados por un daño en el lóbulo 
frontal. Esta tarea consiste en un par de filas con cinco círculos cada una, de los 


cuales uno está relleno y el resto no. El sujeto tiene que decidir qué círculo se 
rellenará a continuación, un proceso que viene determinado por una de ocho 
posibles reglas abstractas diferentes, por ejemplo, el círculo de al lado, o 
posiblemente una combinación entre dos círculos. La tarea proporciona tres 
puntuaciones, (a) el número de respuestas correctas, (b) número de respuestas 
raras no proporcionadas antes por los sujetos control, y (c) número de veces en 
las que el sujeto cambia de regla cuando esta todavía sigue funcionando 
adecuadamente. Las puntuaciones a y b correlacionan altamente entre ellas (r = 
0,6), mientras que la c no correlaciona ni con la a (r = 0,13) ni con lab (r= 
0,13). Sin embargo, las tres medidas muestran una disminución del rendimiento 
al comparar a los pacientes con un daño en el lóbulo frontal con pacientes 
igualados en inteligencia según su rendimiento en el WAIS pero cuyas lesiones 
están en áreas más posteriores. Shallice y Burgess sugieren que tanto el número 
de respuestas correctas como el número de respuestas raras reflejan fallos en la 
generación de estrategias, lo que supone un deterioro en la Fase 1, mientras que 
la puntuación en c refleja un fallo en la Fase 2 de implementación del esquema. 
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Fig. 7.1. El modelo del Sistema Supervisor Mark II desarrollado por Shallice y 
Burgess (1996). Todo el diagrama (excepto el componente «Contention 
Scheduling»*) se refiere al procesamiento del sistema supervisor. En el interior 
del rectángulo grande que representa las distintas fases del funcionamiento del 
Sistema Supervisor están representadas mediante elipses las distintas fases 
temporales del funcionamiento del Sistema Supervisor (tomado de Shallice, 
2002), Fraccionamiento del Sistema Supervisor en D. T. Stuss y R. T. Knight 
(eds.), Principios del funcionamiento del lóbulo frontal, p. 263, New York, 
Oxford University Press). 


* Un sistema de organización jerárquica de esquemas y de la gestión automática 
de los conflictos entre ellos. N. de la T. 


7.3. Memoria de trabajo y procesos ejecutivos 


Como psicólogo cognitivo, siento que tengo que ser capaz de contribuir a la 
comprensión de los procesos ejecutivos, complementando a los enfoques más 
neurobiológicos o computacionales. En mi caso, como no he tenido buen acceso 
a pacientes con lesiones en los lóbulos frontales claramente delimitadas, o a las 
facilidades locales que ofrece la neuroimagen, me he concentrado 
principalmente en sujetos normales, junto con investigaciones de pacientes con 
enfermedad de Alzheimer (EA). Un enfoque (Baddeley, 1996) consistía en 
intentar retroceder a los primeros principios e identificar los procesos que 
cualquier sistema ejecutivo requeriría para poder funcionar con efectividad. 
Después de identificar estos subprocesos, intenté encontrar una serie de tareas 
sobre las cuales cabría esperar razonablemente que dependieran. Si los procesos 
ejecutivos postulados fueran de hecho tan fundamentales, entonces deberían 
funcionar a lo largo de una serie de modalidades y deberían aplicarse a una serie 
de situaciones y tareas. Identifiqué cuatro procesos candidatos, concretamente, la 
Capacidad para focalizar la atención, la capacidad para dividir la atención entre 
dos tareas concurrentes, la capacidad para desplazar la atención de una tarea a 
otra y, finalmente, la capacidad para integrar la memoria de trabajo y la MLP 


(Baddeley, 1996c). Las tres primeras se discuten más abajo y la cuarta se 
discutirá en el próximo capítulo. Por supuesto, el estudio de la atención es un 
campo que ha sido muy investigado (ver Pashler [1998], para una revisión 
reciente). Lo que sigue no es un intento de revisar este campo tan extenso y tan 
desarrollado, sino simplemente mi propio intento de crear el puente necesario 
entre el estudio de la atención y el análisis del ejecutivo central. 


7.4. Focalizando la capacidad limitada 


Uno de los rasgos más importantes de la memoria de trabajo es quizá la 
capacidad para dirigir y focalizar la atención. La evidencia de que el sistema 
tiene una capacidad limitada es en general sorprendente, lo que no significa que 
bajo ciertas condiciones altamente definidas se puedan ejecutar complejas tareas 
de forma simultánea. Un buen ejemplo de esto es la demostración de Allport et 
al. (1972) de la capacidad de un experto pianista para tocar una pieza tan solo 
leyéndola, sin haberla interpretado antes, al mismo tiempo que repite una serie 
de frases en el menor tiempo posible, sin mostrar evidencias de una interferencia 
aparente. Si tenemos en cuenta el punto de vista del modelo de Norman y 
Shallice, se supone que ambas tareas podrían ejecutarse, al menos en este caso, 
usando esquemas existentes muy trabajados, que se pueden intercalar con una 
demanda relativamente pequeña para el sistema SAS. No hay duda de que un 
pianista menos experimentado mostraría una interferencia. 


7.4.1, Control atencional en las tareas complejas 


De todas las demostraciones sobre la capacidad limitada del control atencional 
vamos a considerar una, el estudio de Robbins et al. (1996) acerca del 
rendimiento de los jugadores de ajedrez moderadamente buenos y muy buenos. 
El trabajo surgió a partir del estudio de Holding (1989), que demostró que contar 
de tres en tres hacia atrás interfería en el recuerdo de los movimientos del 
ajedrez, y concluyó que esto reflejaba la importancia de la codificación verbal. 
Pusimos en entredicho esta interpretación, usando la metodología de la doble 


tarea para poner a prueba otras hipótesis. Tanto los jugadores buenos como los 
muy buenos intentaron retener un movimiento de ajedrez que se había mostrado 
brevemente, bien bajo condiciones de control o bien ejecutando una serie de 
tareas concurrentes secundarias, designadas para interferir con cada uno de los 
tres componentes de la memoria de trabajo. La supresión articulatoria se usó 
para interrumpir al bucle fonológico, la tarea del tamborileo espacial se empleó 
para interrumpir a la agenda y la generación aleatoria de secuencias de números 
se usó para interrumpir al ejecutivo central. 


Tal como esperábamos, el rendimiento de la memoria correlacionó altamente con 
la habilidad para el ajedrez. Sin embargo, tanto el grupo de expertos como el 
grupo de los novatos mostraron el mismo patrón de interrupción por parte de las 
tareas secundarias, concretamente la supresión articulatoria no supuso ningún 
deterioro, el tamborileo espacial supuso un deterioro moderado, pero cuando se 
pidió la generación verbal aleatoria se obtuvo un descenso sustancial del 
rendimiento, lo que sugería que el resultado previo de Holding, más que una 
interrupción del procesamiento verbal como él había propuesto, reflejaba la 
demanda ejecutiva que suponía contar hacia atrás. 


Un segundo experimento consistió en presentar a los novatos y a los expertos 
ajedrecistas un movimiento en la mitad del juego y pedirles que eligieran el 
siguiente movimiento más apropiado. De nuevo, el rendimiento correlacionó con 
la valoración de las habilidades ajedrecistas, y de nuevo la supresión articulatoria 
no supuso ninguna influencia, mientras que el tamborileo espacial y la 
generación aleatoria sí que interfirieron. De hecho, para que los sujetos pudieran 
rendir bien por completo, se tuvo que reducir la tasa de generación aleatoria 
concurrente requerida. También se describieron resultados ampliamente 
equivalentes en un extenso estudio de Saariluomo (1995) sobre la psicología 
cognitiva del ajedrez, en el que se obtuvieron escasas evidencias de la 
codificación verbal, junto con el uso de habilidades visoespaciales y ejecutivas. 


El concepto de un sistema atencional de capacidad limitada es tan viejo como la 
psicología cognitiva (Miller, 1956; Welford, 1956; Broadbent, 1958; Fitts y 
Posner, 1967; Neisser, 1967). Sin embargo, esto no significa simplemente que 
cuanto más difícil sea la tarea mayor es la demanda atencional (Allport et al. , 
1972; Logie et al. , 2004). Por ejemplo, siguiendo con nuestros estudios sobre el 
ajedrez (Baddeley y Robins, datos sin publicar), les pedimos a nuestros sujetos 
que observaran brevemente una partida abandonada hacia la mitad y decidieran 
quién llevaba ventaja, si las blancas o las negras. Esta es una tarea muy difícil, 


que correlacionaba con la experiencia del ajedrecista. Sin embargo, el 
rendimiento en esta tarea no se vio interrumpido por la carga de una tarea 
concurrente. Creemos que esto se debía a que no dejábamos el tiempo suficiente 
para ejecutar un análisis sistemático de los movimientos, obligando a los sujetos 
a confiar en un juicio relativamente automático sobre patrones basados en el 
reconocimiento de movimientos. De forma consistente, observamos que una 
reducción de la cantidad de tiempo disponible para realizar los juicios no influyó 
en el rendimiento. 


7.4.2, Práctica y automaticidad 


Una segunda variable que interactiva con la demanda ejecutiva es la práctica. En 
un estudio sobre pensamientos independientes del estímulo, es decir, la tendencia 
a dejar vagar la mente, Teasdale et al. (1995) demostraron que ejecutar una tarea 
no familiar era suficiente para interrumpir esos pensamientos, mientras que 
ejecutar la misma tarea después de una serie de ensayos de práctica no tuvo el 
mismo efecto. Este resultado es consistente con la clásica demostración de 
Schneider y Shiffrin (1977) de que la experiencia que se acumula al buscar 
repetidamente un conjunto limitado de estímulos-respuestas reduce la demanda 
atencional de la tarea en cuestión. En una tarea con presos, quienes 
presumiblemente disponían de tiempo para practicar, Mowbray y Rhoades 
(1959) investigaron el efecto de la práctica prolongada sobre la Ley de Hick. La 
ley establece que, dada una tarea que implique reaccionar tan rápido como sea 
posible, por ejemplo, presionando un botón en respuesta a una luz asociada, el 
tiempo de reacción se incrementa logarítmicamente con el número de 
alternativas estímulo-respuesta. Hick propuso que la pendiente de la función 
indicaba la tasa con la que el sujeto es capaz de procesar la información. Sin 
embargo, después de practicar de manera suficiente, los presos consiguieron una 
función plana. Parece que practicando lo suficiente, la demanda de control 
atencional se vuelve mínima, al mismo tiempo que los procesos automáticos 
basados en hábitos se vuelven más eficientes. 


Sin embargo, otro complicado factor es la estrategia adoptada. La capacidad para 
generar ejemplos a partir de una categoría semántica, como, por ejemplo, la 
categoría de animales, parece ser una tarea de gran demanda ejecutiva. Es 


altamente sensible al daño en los lóbulos frontales (Milner, 1964) y fácilmente 
interrumpida por una tarea concurrente como, por ejemplo, el tiempo de reacción 
en la elección (Baddeley et al. , 1984b), o la generación aleatoria (Baddeley et al. 
, 1998b). Rosen y Engle (1997) encontraron, tal como cabría esperar, que los 
sujetos con grandes amplitudes de memoria de trabajo puntuaban alto en esta 
tarea, y mostraban un claro deterioro cuando tenían que ejecutar una tarea 
concurrente. Sin embargo, paradójicamente, los sujetos con amplitudes pequeñas 
no mostraron un deterioro al ejecutar la tarea secundaria, presumiblemente 
porque, a diferencia de los sujetos con amplitudes grandes, estos sujetos no 
usaban estrategias de demanda atencional, incluso bajo condiciones de control. 
La cuestión de la estrategia ha dominado la literatura, ya que la esencia del 
sistema de memoria de trabajo es su flexibilidad. Sin embargo, la explicación en 
base a la estrategia empleada puede criticarse por permitir realizar explicaciones 
post hoc de prácticamente cualquier hallazgo experimental no deseado. Estas 
explicaciones son mucho más convincentes cuando son apoyadas por estudios 
posteriores que controlan explícitamente la estrategia (e.g., Hanley y 
Bakopoulou, 2003). 


7.4.3. Generación aleatoria 


Un beneficio no esperado que se obtuvo con el modelo SAS de Norman y 
Shallice fue la posibilidad de explicar los datos previos acerca de la capacidad 
para generar secuencias aleatorias. Esta parece ser una tarea muy demandante. 
Por ejemplo, cuando se pide a los sujetos que generen una secuencia aleatoria de 
letras, los sujetos tienden a favorecer unas letras frente a otras, generando 
excesivas secuencias en orden alfabético, como, por ejemplo, AB, RS y XYZ, y 
evitan repeticiones de letras como AA y RR (Towse, 1998; Tune, 1964). Este 
sesgo que se aleja de la emisión de respuestas aleatorias se incrementa con la 
tasa de velocidad de generación y en condiciones de doble tarea, en las que se 
demanda una tarea secundaria (Baddeley, 1966c). La generación aleatoria se 
resistía a los primeros intentos de interpretación dentro de un marco de trabajo 
estímulo-respuesta más convencional, pero sí pareció prestarse al modelo de 
Norman y Shallice, que distingue entre responder sobre la base de hábitos 
arraigados y la capacidad de intervención del SAS. Por tanto, dada la instrucción 
de producir una serie de letras, la tendencia natural sería usar un esquema 


alfabético, o generar acrónimos comunes como USA y CIA. Sin embargo, si la 
instrucción es generar una secuencia aleatoria, claramente se tendría la necesidad 
de evitar estas secuencias estereotipadas, produciéndose una tensión entre lo que 
es fácil de recuperar y lo que es óptimo. Por tanto, parece que explorar la 
naturaleza de la generación aleatoria nos ofrece la posibilidad de arrojar luz 
sobre los procesos fundamentales implicados en el control ejecutivo de la acción. 


En una serie de experimentos posteriores dejamos de pedir que generaran 
información verbal alfanumérica y decidimos abordar el problema pidiéndoles 
que presionaran al azar una serie de diez botones (Baddeley et al. , 1998b). Hubo 
dos razones por las cuales hicimos esto. La primera era una cuestión práctica, ya 
que los sujetos tenían que introducir las respuestas directamente en el ordenador 
y así se simplificaban los análisis. La segunda fue más teórica, relacionada con 
el supuesto de que los procesos ejecutivos eran relativamente independientes de 
la modalidad. Si efectivamente era así, deberíamos observar fenómenos 
ampliamente similares independientemente de si el sujeto debía pronunciar una 
secuencia de números o de letras o de si tenía que presionar una secuencia de 
botones. 


Por tanto, nuestro primer experimento estudiaba la influencia de la tasa de azar 
sobre la redundancia de la secuencia de respuesta resultante, usando bien los 
dígitos 0-9, o bien diez botones, dispuestos de manera equidistante a las dos 
manos. Aunque la producción verbal fue algo más aleatoria, el efecto de la tasa 
de producción fue equivalente, las producciones más rápidas dieron lugar a 
secuencias estadísticamente menos aleatorias. Al igual que en los estudios 
anteriores (Baddeley, 1966c), también encontramos que a medida que la 
velocidad se incrementaba, también se incrementaba el número de respuestas 
estereotipadas. En el caso de los botones, las primeras secuencias preferidas 
consistían en presionar el botón homólogo con la otra mano, seguido del botón 
adyacente en la misma mano, y luego el adyacente en la otra. Combinamos 
nuestra tarea de pulsar botones al azar con tareas verbales concurrentes, para ver 
si la cantidad de azar era sensible a la demanda de tareas concurrentes. Esto fue 
lo que ocurrió. Se sabe que solicitar la producción de ítems a partir de categorías 
semánticas demanda atención y es sensible al daño en el lóbulo frontal (Milner, 
1982). Como tarea concurrente, redujo la presión aleatoria de los botones de 
forma sustancial. Pedirles que ejecutaran un test de inteligencia concurrente fue 
incluso más disruptivo (Baddeley et al. , 1998). 


En este punto estábamos pensando, más que en términos generales, en términos 


de algún componente ejecutivo específico, necesario para la producción y para 
otras tareas cognitivas importantes. En un intento de poner a prueba esta 
hipótesis más bien vaga, decidimos combinar la tarea de presionar el teclado de 
manera aleatoria, con la tarea de producción verbal de secuencias de dígitos 
aleatorias. Esperábamos que esto causara una sobrecarga dramática en el 
supuesto componente específico, y un fracaso en el rendimiento. Nos esperaba 
una sorpresa. Cuando ambas tareas se combinaron, la tarea de presión aleatoria 
del teclado se vio deteriorada de la misma manera que hubiera ocurrido si se 
hubiera combinado con la tarea de generación verbal de categorías, pero, sin 
embargo, la tarea de generación aleatoria de números solo se vio mínimamente 
interrumpida. 


Para explicar este resultado inesperado, nos vimos obligados a recapacitar con 
más detalle sobre los procesos implicados. Sugerimos que la generación 
aleatoria implicaba al menos cuatro procesos, seleccionar un «plan de 
recuperación», llevarlo a cabo, comprobar el resultado para evitar estereotipos o 
repeticiones y, si fuera necesario, adoptar otro plan de recuperación. Existen 
pruebas que sugieren que una vez que se especifica el plan, el proceso de 
recuperación en sí mismo es relativamente poco demandante (Baddeley et al., 
1984; Crack et al. , 1996; Naveh-Benjamin et al. , 2000). Más aún, si asumimos 
que los planes de recuperación verbales y motores en gran medida no se 
interfieren mutuamente, entonces probablemente la carga impuesta debería haber 
tenido efecto sobre la fase de comprobación del resultado, o sobre la fase de 
cambio de estrategia de recuperación, o a lo mejor sobre las dos. Ambas fases 
tienen lugar después de que se haya emitido la respuesta. Por tanto, el deterioro 
de cualquiera de estos dos procesos no habría producido una interrupción 
inmediata dramática, sino simplemente habría incrementado la redundancia de 
las respuestas, al no producirse el cambio con la frecuencia suficiente. Los 
comentarios de los sujetos sugirieron que las secuencias estereotipadas y las 
desviaciones del proceso azaroso en la generación verbal son mucho más 
notables que en la tarea del teclado. De hecho, algunos sujetos dijeron 
(erróneamente) que al ejecutar una tarea concurrente demandante, la presión 
aleatoria del teclado se volvió más fácil, algo que nunca se dijo con la 
generación verbal. Por tanto, parecía como si nuestros sujetos estuvieran 
controlando y manteniendo la generación verbal a expensas del deterioro de la 
tarea manual menos notoria. 


Decidimos poner a prueba nuestra hipótesis del cambio de estrategia, 
combinando la tarea de presión del teclado con una tarea que implicaba en sí 


misma frecuentes cambios, creyendo que esto interrumpiría la fase de cambio y, 
por tanto, el rendimiento se deterioraría dramáticamente, aunque el cambio en sí 
mismo fuera muy predecible. Elegimos una tarea que se basaba en una prueba 
neuropsicológica muy utilizada, el Test Trails, que se supone que mide el cambio 
en la tarea. Consiste en una serie de números y letras esparcidos en una hoja de 
papel. En la condición básica, Trails A, se le presentan al sujeto números o 
letras, y con un lápiz tiene que ir uniendo el primer ítem, por ejemplo, el número 
1, con el siguiente, el número 2, y así trazar un camino conectando los números 
en orden ascendente. En el caso de las letras, el sujeto comienza con la letra A y 
sigue en orden alfabético. En la condición de cambio, Trails B, se le muestran al 
sujeto una serie de números y letras mezclados y tiene que ir alternando, es decir, 
empezando por la A, tiene que unirla con el 1, luego tiene que unirse con la B y 
la B con el 2, etc. Como estábamos estudiando una producción manual, ideamos 
una versión verbal del Test Trails que fuera equivalente. En este caso, el sujeto 
recitaba letras del alfabeto, o bien contaba. En la condición crucial de cambio, se 
les pedía que produjeran secuencias verbales alternas, como, por ejemplo, A, 1, 
B, 2, C, 3, etc. Cuando combinamos esta tarea verbal alternante con la tarea de 
producción manual aleatoria, encontramos un descenso sustancial respecto al 
grado de azar, un resultado que consideramos consistente con nuestro supuesto 
de que el componente alternante de la tarea del Test Trails estaba interrumpiendo 
la fase de cambio de la tarea de producción aleatoria. A su vez, esto nos llevó a 
la hipótesis de que la capacidad para desplazar la atención podría representar una 
función ejecutiva básica e independiente. Pusimos a prueba esta hipótesis usando 
de nuevo la metodología de la doble tarea. 


7.5. Tarea de cambio y ejecutivo central 


En 1927, Jersild publicó una amplia serie de experimentos que intentaban medir 
el coste atencional que suponía cambiar de una tarea a otra. El experimento 
típico consistía en una lista de pares de dígitos, los sujetos tenían que sumar los 
dos dígitos en una condición, y en la otra, tenían que restar el segundo dígito del 
primero, y en otra, ir alternando la suma en unos dígitos y la resta en otros. 
Encontraron que la alternancia disminuía el rendimiento sustancialmente. De 
manera sorprendente, su trabajo fue prohibido durante casi medio siglo, hasta 
que Spector y Biederman (1976) reintrodujeron el paradigma alternante de la 


tarea aritmética, demostrando, entre otras cosas, que el coste de la alternancia se 
reducía sustancialmente, incluso desaparecía, si se proporcionaba el signo de la 
suma y de la resta correspondiente, en vez de simplemente decirles que tenían 
que ir alternando. 


7.5.1. Alternar y ejecutivo central 


Pasaron casi 20 años antes de que el tema fuera reavivado en un influyente 
artículo de Allport et al. (1994), que cuestionaba directamente la idea 
ampliamente sostenida de que la tarea de cambio suponía un proceso de 
demanda atencional, que dependía de un sistema de control ejecutivo de 
capacidad limitada. Esta perspectiva fue cuestionada a su vez por Rodgers y 
Monsell (1995), quienes encontraron que sus sujetos podían reducir el coste que 
suponía cambiar si se les proporcionaban las pistas apropiadas y el tiempo 
suficiente para procesar esta información. Posteriormente, esta área de 
investigación se ha vuelto extremadamente activa; en ella, la propuesta de que el 
cambio puede reflejar el funcionamiento de la función ejecutiva unitaria ha 
demostrado ser excesivamente optimista (ver Monsell [2005], para una revisión 
más reciente). Sin embargo, para los objetivos presentes, en lugar de revisar esta 
literatura tan compleja y desarrollada, me centraré en una serie de experimentos 
propios, los cuales, aunque no consiguieron esclarecer los mecanismos que 
subyacen a la tarea de cambio, sí modificaron valiosamente mi propio concepto 
sobre la memoria de trabajo. 


Al investigar la posible existencia de un componente de cambio específico 
dentro del ejecutivo central, usamos el paradigma básico de Jersild en el que se 
pide alternar una lista de ítems impresos. Queríamos una tarea que pudiera 
usarse en clínica, que incluyera un equipamiento mínimo y que fuera fácilmente 
comprensible y fácil de ejecutar por sujetos normales y por pacientes que 
sufrieran demencia. Optamos por una tarea sencilla de lápiz y papel que nos 
había dado resultados robustos, aunque no nos permitiera medir de manera 
detallada las respuestas individuales, lo que sí hubiéramos podido hacer con 
técnicas más sofisticadas. La tarea consistía simplemente en presentarle al sujeto 
una columna solo con dígitos. En una condición tenían que sumar un 1 a cada 
dígito, en la segunda condición debían restar el 1 a cada dígito y en la condición 


crucial de cambio se pidió que alternaran entre la suma y la resta. Encontramos 
claras evidencias del coste que suponía la condición alternante, incluso aunque 
se les proporcionaran los signos de la suma y de la resta en cada caso. 
Encontramos que en los pacientes con EA ( Enfermedad de Alzheimer) el coste 
de la tarea alternante fue particularmente alto. Decidimos explorar la tarea con 
más detalle usando sujetos normales y estudiando el cambio mientras que 
ejecutaban una serie de tareas secundarias (Baddeley et al. , 2001b). 


Nuestro primer experimento estudió el efecto que causaba omitir o incluir los 
signos más y menos, combinando esto con la ejecución simultánea de la tarea 
Trails verbal, descrita previamente. Creíamos que si efectivamente existía un 
componente ejecutivo especializado en el cambio, entonces este debería estar 
dramáticamente sobrecargado por la necesidad de cambiar al mismo tiempo, 
tanto en la tarea aritmética como en la tarea Trails verbal. 


Decidimos no usar nuestra versión previa 1-A-2-B-3-C, ya que nos preocupaba 
que el componente de contar pudiera interferir directamente con las sumas y las 
restas implicadas en la tarea principal. En su lugar, pedimos que recitaran los 
ítems pertenecientes a dos conjuntos familiares, los días de la semana y los 
meses del año. Por tanto, los sujetos tendrían que recitar los días, los meses, o 
bien alternarlos (e.g., Enero-Lunes-Febrero-Martes-Marzo-Miércoles, etc.). Sin 
embargo, necesitábamos otro control más. Parecía posible, aunque poco 
probable, que simplemente con la supresión articulatoria el rendimiento se viera 
deteriorado. Por tanto, incluimos una condición de supresión articulatoria en la 
cual los sujetos recitaban repetidamente en orden correcto o bien los días de la 
semana o bien los meses del año. Nuestros resultados se agruparon en dos 
categorías. Cuando se les proporcionaban los signos más y menos, ofreciéndoles 
así una pista directa sobre si en un ítem concreto había que sumar o restar, 
apareció un efecto del cambio, modesto pero con una alta fiabilidad, el cual se 
incrementó ligeramente al añadirle la tarea Trails verbal, pero no al añadir la 
tarea de supresión articulatoria. El cambio, por tanto, parece que supone una 
carga en los procesos ejecutivos, pero los efectos no son muy dramáticos y, por 
tanto, no apoyan la idea de un subproceso de cambio específico que se hubiera 
visto muy interrumpido al pedir que ejecutaran dos tareas de cambio 
concurrentes. 


Sin embargo, cuando no se proporcionaron los signos, el deterioro fue mucho 
más dramático. Y lo que es más sorprendente, incluso la condición de supresión 
articulatoria supuso una dificultad sustancial, lo que sugería que el bucle 


fonológico tenía un papel importante en el control de la acción. Sin embargo, un 
revisor de nuestro artículo nos sugirió que a lo mejor recitar los meses del año, o 
incluso los días de la semana, no era una tarea tan sencilla como nosotros 
habíamos supuesto. Este fue el caso, ya que, de hecho, los efectos observados se 
redujeron cuando la supresión articulatoria consistió simplemente en repetir la 
palabra «la», aunque el resto del patrón observado sí permaneció igual 
(Baddeley et al. , 2001b). 


7.5.2. ¿El papel ejecutivo del bucle fonológico? 


En un estudio posterior Emerson y Miyake (2003) ampliaron este resultado, 
variando la dificultad de la tarea de la suma y la resta, y comparando el cambio 
con dos y con tres operaciones. Se replicó el efecto sustancial de la supresión 
articulatoria. El incremento del nivel de la dificultad o del número de veces que 
se cambiaba de operación incrementó el tiempo general de procesamiento, pero 
estos factores no interaccionaron con el efecto de la supresión articulatoria. En 
otro experimento se fueron variando las pistas que informaban del cambio de 
operaciones aritméticas. Cada ítem se presentaba, bien sin ninguna pista, bien 
acompañado de un claro signo positivo o negativo o bien en la condición 
intermedia, se presentaba con un color que indicaba la adición o la sustracción. 
El coste del cambio dependía de la fuerza de la pista, siendo mayor en la 
condición sin pista y menor cuando se acompañaba de signos aritméticos, pero 
de nuevo el efecto no interaccionó con la presencia o la ausencia de la supresión 
articulatoria. 


Emerson y Miyake interpretaron sus resultados en términos de un empleo de los 
indicios del habla para controlar la conducta: «Dado que el habla (interna o 
privada) genera un rendimiento serial con propiedades tales como la duración, la 
replicabilidad y la evocación de información relacionada, el habla privada está 
bien equipada para servir a una variedad de funciones de control» (Carlson, 
1997, p. 168). Entre sus ventajas se incluye el hecho de que es inherentemente 
secuencial y, por tanto, lleva buena cuenta del orden de las acciones. El bucle 
fonológico mantiene un número de ítems limitado, los cuales se encuentran 
fácilmente disponibles para la conciencia. El contenido verbal del bucle 
fonológico desencadena otras respuestas fácilmente, entre las que se incluyen 


tanto las asociaciones semánticas como los principales propósitos de las tareas. 
El habla subvocal se usa con frecuencia y es resistente a la interferencia. 
Finalmente, tiene la ventaja de que se puede mantener con una demanda 
atencional relativamente pequeña. 


Más evidencias del uso del control verbal en tareas de cambio provienen de 
estudios clínicos en los que se usa el Test de Clasificación de Tarjetas de 
Wisconsin, en el que los sujetos tienen que clasificar las tarjetas en categorías; la 
categorización correcta la obtienen a partir de la retroalimentación del 
examinador. Una vez que se ha alcanzado una categoría correctamente, el 
examinador la cambia, dejando que el paciente detecte el cambio e identifique 
cuál es la siguiente categoría (Milner, 1964). Los pacientes con un daño en el 
lóbulo frontal tienden a tener dificultades para cambiar de una categoría a la 
siguiente, lo que está sugiriendo una dependencia de los procesos ejecutivos. 
Dunbar y Sussman (1995) encontraron que el cambio también se veía 
deteriorado con la supresión articulatoria, mientras que Perry et al. (2001) 
notaron que cuando enseñaban a sus pacientes con esquizofrenia a verbalizar sus 
hipótesis, el rendimiento mejoraba. Finalmente, hay pruebas de que el coste del 
cambio puede incrementarse en pacientes afásicos, en los que el grado de 
interrupción correlaciona con su grado de deterioro del habla (Mecklinger et al. , 
1999). 


La propuesta de que el habla puede jugar un papel importante en el control de la 
acción no es nueva. Fue un componente importante de la aproximación de 
Vygotsky (1962) al desarrollo cognitivo, enfatizando el papel del habla en el 
desarrollo de los procesos de pensamiento. Luria (1959) desarrolló aún más estas 
ideas, llevando a cabo una serie de ingeniosos experimentos sobre el papel del 
habla en el control de la acción. Empleó una tarea en la que se pedía al niño que 
estrujara una bombilla cuando se encendiera la luz roja y que no lo hiciera 
cuando la luz fuera azul. Por debajo de los tres años, los niños tienden a estrujar 
la bombilla en respuesta a las dos luces, a pesar de que sí son capaces de 
explicarte las instrucciones correctamente, y ejecutan bien la tarea cuando el 
experimentador les dice «presiona» cuando aparece la luz roja y «no presiones» 
cuando aparece la luz azul. Hacia los tres años y medio los niños empiezan a ser 
capaces de responder verbalmente de manera apropiada, pero siguen sin ejecutar 
bien la acción. Entre los cuatro y los cinco los niños aprenden finalmente a 
acompañar su habla con la acción apropiada, y con el paso del tiempo ejecutan la 
acción sin hablar. Luria (1959) continuó demostrando un fenómeno similar en 
pacientes neuropsicológicos con un daño en el lóbulo frontal, lo que originó el 


desarrollo posterior de un enfoque de rehabilitación neuropsicológica en el que 
se anima al paciente a controlar la acción mediante autoinstrucciones en voz alta. 


Retomando el papel de la atención en la tarea de cambio, hay ciertos indicadores 
de que la demanda ejecutiva concurrente que requieren las tareas como el test 
Trails verbal o la tarea de generación aleatoria puede interaccionar con el 
cambio, sugiriendo que, al menos bajo ciertas circunstancias, el cambio puede 
ser atencionalmente demandante. Sin embargo, no existen pruebas firmes de un 
componente específico del ejecutivo que se dedique exclusivamente al cambio. 
De hecho, el cambio, bajo ciertas circunstancias, parece que acentúa el 
rendimiento. Los sujetos a los que se les pide que escriban secuencias de letras 
lo más rápido que puedan responden más lentamente cuando repiten la misma 
letra (A, A, A, A, etc.) que cuando van cambiando ( A, B, A, B, etc.), lo que a 
su vez es ligeramente más lento que si repiten largas secuencias (como A, B, C, 
D, A, B, CG, D, etc.), un resultado que parece reflejar la acumulación de algún 
tipo de inhibición (Nohara, 1965; Wing et al. , 1979). Por tanto, aunque existe un 
número creciente de hipótesis acerca de los factores que subyacen a la tarea de 
cambio, yo estoy más de acuerdo con Rubinstein et al. (2001), que sugieren que 
cambiar no es una función general, sino un proceso cuyos costes o beneficios 
probablemente varíen dependiendo de la situación concreta y de la estrategia 
adoptada por el sujeto. 


7.6. La división de la atención como habilidad ejecutiva 


En ocasiones necesitamos claramente repartir nuestra atención a más de una 
tarea. Por ejemplo, ahora mismo voy andando bajo la lluvia por una calle 
estrecha, dictando mis palabras a la vez que sostengo un paraguas con cuidado 
de no rasgarlo con las zarzas, mientras que también estoy atento a los coches que 
se aproximan, que probablemente no me ven. La última actividad es 
relativamente poco demandante, pero, dadas las posibles consecuencias, es 
potencialmente importante. Otro posible conflicto multitarea es conducir 
mientras hablas por teléfono, una actividad que ha demostrado ser peligrosa no 
porque se necesite el uso de una mano para sostener el teléfono, sino porque la 
atención se divide. Por ejemplo, ya en el año 1969, Brown et al. demostraron que 
la necesidad de ejecutar una prueba que demandara razonamiento verbal tenía 


poco o ningún efecto sobre la habilidad manual para aparcar entre dos pivotes, 
pero tuvo un impacto sustancial sobre la capacidad del conductor para juzgar si 
el hueco era lo suficientemente ancho. La dificultad para realizar dos tareas a la 
vez es consistente con la idea de la existencia de una capacidad cognitiva 
específica para repartir la atención, pero de ningún modo fuerza esta 
interpretación (para una discusión detallada ver Bourke et al. [1996]). 


7.6.1. El rendimiento en la doble tarea en la enfermedad de Alzheimer 


Mi propia implicación en el estudio de la capacidad para dividir la atención se 
originó a partir de una colaboración en una investigación acerca del déficit 
cognitivo asociado a la enfermedad de Alzheimer. Un estudio inicial indicó que, 
además del marcado deterioro ya establecido sobre la MLP episódica, nuestros 
pacientes también mostraban un deterioro en la memoria inmediata visual y 
verbal (Spinnler et al. , 1988). Especulamos con la posibilidad de que esto 
pudiera reflejar un déficit subyacente en el componente del ejecutivo central 
presente en ambas tareas de MCP, una conclusión consistente con un análisis 
más detallado elaborado por Morris (1984; 1986) sobre la MCP verbal en estos 
pacientes. Sin embargo, la cuestión que surge es cómo medir el déficit ejecutivo 
propuesto. 


Si usamos el básico modelo tripartito de la memoria de trabajo, parece posible 
asumir que si fuera necesario coordinar dos o más actividades separadas se 
necesitaría el ejecutivo. Más aún, si una actividad dependiera principalmente del 
bucle fonológico, y la otra de la agenda, entonces seríamos capaces de evitar 
fuentes de interrupción perceptivas o motoras más periféricas. En nuestro primer 
estudio usamos una tarea de seguimiento visoespacial, en la que los sujetos 
tenían que mantener una varilla en contacto con un punto de luz móvil. Variando 
la velocidad de movimiento del punto diana podíamos equiparar el nivel de 
rendimiento de nuestros tres grupos, el de los pacientes en las primeras etapas de 
la enfermedad de Alzheimer (EA), el de los sujetos normales ancianos igualados 
en edad y el de los sujetos jóvenes. Cada grupo logró seguir la diana cerca de un 
70 por ciento del tiempo. Combinamos la tarea de seguimiento con una de las 
tres posibles tareas secundarias, una implicaba la supresión articulatoria, Otra 
presionar con el pie un pedal en respuesta a un estímulo auditivo, mientras que la 


tercera consistía en escuchar y repetir secuencias aleatorias de dígitos. En el caso 
de las tareas de amplitud de memoria, nos aseguramos previamente, mediante un 
examen previo, que la longitud de la secuencia de dígitos se situaba al mismo 
nivel de amplitud en los tres grupos. Cada una de las tres tareas se combinaba 
entonces con la tarea del rotor de persecución. 


La supresión articulatoria no produjo deterioros significativos en ningún grupo. 
En los dos grupos control encontramos un ligero decremento en la tarea del 
tiempo de reacción y en la de amplitud de dígitos que fue ampliamente 
equivalente en los sujetos normales jóvenes y viejos. Sin embargo, los sujetos 
con EA mostraron un deterioro sustancialmente mayor al tener que combinar las 
dos tareas (Baddeley et al., 1986). Posteriormente se realizó otro estudio 
longitudinal (Baddeley et al. , 1991). Encontramos que, a medida que avanzaba 
la enfermedad, su capacidad para ejecutar una sola tarea apenas cambiaba, 
mientras que la capacidad para realizar dos tareas simultáneamente disminuía 
sistemáticamente. ¿Podría ser que la condición de la doble tarea fuera más difícil 
y, por tanto, más sensible a los efectos de la EA? Esto parece poco probable, ya 
que el incremento de la dificultad de una tarea de juicios semánticos realizada en 
solitario no tuvo un efecto diferenciador sobre los enfermos de Alzheimer 
(Baddeley et al. , 1991). 


Interpretamos estos resultados en términos de un componente específico del 
ejecutivo central relacionado con la coordinación de las dobles tareas, el cual se 
encuentra deteriorado en los pacientes con EA. Sin embargo, a diferencia de 
otras Capacidades cognitivas como la memoria episódica, la capacidad para 
dividir la atención parece estar comparativamente preservada en ancianos 
normales (ver también Salthouse et al. , 1998). Si pudiéramos establecer esto con 
firmeza, entonces habríamos conseguido dos cosas, progresar teóricamente en el 
fraccionamiento del ejecutivo central y una prueba clínica potencialmente útil 
que podría sernos de gran utilidad para decidir si un paciente olvidadizo es o no 
es susceptible de sufrir EA. 


En una revisión del déficit atencional asociado con la EA, Perry y Hodges 
(1999) creyeron que la capacidad para dividir la atención era una de las 
candidatas más fuertes para distinguir la presencia de la enfermedad como un 
déficit separado. Sin embargo, tal como apuntaron, se podrían dar 
interpretaciones alternativas, como por ejemplo en términos del nivel de 
dificultad, o simplemente como un ejemplo de un déficit más general en la 
velocidad de procesamiento. Se ha propuesto que el principal déficit que se 


produce con el envejecimiento normal es la disminución de la velocidad de 
procesamiento (Salthouse, 1992; 1996), aunque el mismo argumento se ha 
propuesto en el caso de la EA (Nebes y Brady, 1985). 


Este tema se ha tratado en dos estudios posteriores. Baddeley et al. (2001a) 
demostraron una vez más que el incremento del nivel de dificultad de una tarea 
no la hacía necesariamente más sensible a la EA. Comparamos el tiempo de 
reacción simple y el tiempo de reacción de elección (TR), y encontramos que 
tanto los sujetos jóvenes como los ancianos normales y los enfermos de 
Alzheimer en las primeras fases, todos ellos respondieron más rápidamente 
cuando se presentaba un único estímulo, un triángulo cuya respuesta consistía 
simplemente en presionar un botón (TR Simple), que cuando tuvieron que 
responder de forma diferente a triángulos que a círculos (TR de Elección). El TR 
de Elección también fue más sensible a los efectos de la edad, ya que los 
ancianos se vieron más influidos por el incremento del tamaño de los ítems que 
los jóvenes. Sin embargo, no hubo evidencias de que este incremento en el TR 
fuera desproporcionadamente mayor en los pacientes que en los sujetos ancianos 
control. En contraste, sí encontramos, tal como habíamos predicho, un déficit 
desproporcionado en cada uno de los dos paradigmas de la doble tarea. Uno 
implicaba una tarea manual análoga a la del rotor, en la que los sujetos tenían 
que marcar una serie de casillas sobre una hoja de respuestas lo más rápidamente 
posible, mientras que recordaban y repetían secuencias de dígitos a la máxima 
amplitud. 


La otra tarea se alejaba totalmente de cuestiones memorísticas. Presentamos a 
los sujetos una tarea de búsqueda visual formada por líneas de pictogramas. 
Cada línea era precedida por un pictograma diana, y el sujeto tenía que señalar 
sobre esa línea los ítems que coincidieran con el ítem diana. La tarea concurrente 
era análoga a la del pasajero que está sentado en la estación de tren y escucha el 
anuncio de su destino. Elegimos el nombre Bristol, la ciudad en la que el estudio 
se llevó a cabo, y lo mezclamos con otros nombres de ciudades familiares, 
pidiendo a los sujetos que dijeran «Bristol» en cuanto se detectara el nombre. La 
tarea de búsqueda visual junto con la tarea «Bristol» se ejecutaron juntas y por 
separado. Nuestros dos procedimientos de dobles tareas mostraron el efecto 
estándar, concretamente un decremento no significativo como resultado de la 
edad, pero un deterioro muy claro en la doble tarea en el grupo de pacientes con 
EA. Este resultado reforzó la replicabilidad de nuestros hallazgos previos, 
generalizándolos a tareas sin requerimientos memorísticos de ningún tipo. 


En un estudio de Logie et al. (2004) se manejó la hipótesis acerca del nivel de la 
dificultad de una manera más directa. Empleando el paradigma de la tarea del 
rotor y de la amplitud de dígitos concurrentes, ajustamos la velocidad de la tarea 
de seguimiento y la longitud de la secuencia de dígitos hasta un punto en el que 
el grupo de sujetos jóvenes, el de los viejos y el de los pacientes tuvieran un 
rendimiento parejo al realizar estas tareas por separado. Después, variamos el 
nivel de dificultad de cada tarea. En el caso de la tarea de seguimiento, 
redujimos sustancialmente la velocidad del punto de luz para hacerla más fácil y 
aumentamos la velocidad para dificultarla. De manera similar, variamos la 
dificultad de la tarea de amplitud de dígitos, presentando más o menos dígitos 
que los de la amplitud máxima. Cuando las tareas se realizaron por separado, los 
tres grupos de sujetos se comportaron de la misma manera, el rendimiento 
mejoró cuando la tarea se simplificaba y se deterioró cuando se dificultaba. Tras 
haber equiparado el nivel de amplitud o la línea base de la tarea de seguimiento, 
los tres grupos de sujetos ejecutaron las tres funciones sin diferencias 
significativas entre ellas, lo que no proporcionó ningún apoyo a la idea de que un 
simple incremento en la dificultad de la tarea causaría que la tarea fuera más 
sensible a la EA. En otro estudio en el que se usaron los mismos sujetos, se 
emplearon niveles más fáciles en ambas tareas y se observó su rendimiento al 
ejecutarlas por separado y combinadas. Incluso en las condiciones más sencillas, 
los pacientes con EA mostraron un decremento significativo en el rendimiento 
en la doble tarea, mientras que los sujetos control no mostraron signos de 
deterioro. 


7.6.2. ¿Es la combinación de tareas una habilidad ejecutiva? 


Por tanto, podríamos decir, en principio, que nuestros resultados sostienen que la 
capacidad para combinar tareas es una habilidad ejecutiva potencialmente 
disociable, que se mantiene sorprendentemente bien preservada en los ancianos, 
siempre que el rendimiento de los jóvenes y los ancianos en tareas individuales 
se haya equiparado, y que sin embargo está consistentemente deteriorada en 
pacientes con EA. No queremos decir que no sea posible demostrar un efecto de 
la edad; de hecho muchos estudios han anunciado este efecto (ver Riby et al. , 
2004, para una revisión). Sin embargo, los estudios fracasan a menudo al intentar 
equiparar el rendimiento de los grupos en las tareas individuales. Por lo que no 


es sorprendente que, si se le pide a los ancianos que combinen dos tareas cuyo 
rendimiento ya es inferior, el decremento será incluso mayor que el encontrado 
cuando ejecutan una sola tarea en solitario. Incluso cuando se logra equiparar el 
rendimiento en tareas individuales, es posible detectar un efecto de la edad. 
Nuestros resultados sugieren, sin embargo, que este efecto es, como mucho, 
ligero, en comparación con el robusto déficit en la doble tarea que se encuentra 
en los pacientes con EA. Por tanto, sugerimos que la capacidad para dividir la 
atención es un posible componente del ejecutivo central, aunque asumimos que 
solo el tiempo nos podrá decir cómo de generalizables son estos resultados. 


Afortunadamente, ya existen pruebas de alguna forma de generalización, con 
una significación práctica potencial. Hartman et al. (1992), por ejemplo, 
aplicaron nuestros hallazgos a la labor de un fisioterapeuta que trataba a un 
paciente que había sufrido un daño cerebral. Compararon la capacidad del 
paciente para ejecutar una tarea motora en solitario con el rendimiento cuando la 
tarea se acompañaba de palabras de aliento generales o cuando se acompañaba 
de una conversación amistosa. Los sujetos normales eran capaces de realizar la 
tarea independientemente de la distracción. Los pacientes con daño cerebral 
tampoco mostraron el efecto causado por las palabras de aliento, pero su 
rendimiento sí disminuyó cuando se acompañaba de una conversación amistosa, 
un efecto particularmente marcado en pacientes con un daño en el lóbulo frontal. 
En otro estudio, Alberoni et al. (1992) estudiaron la capacidad de pacientes con 
EA para recordar el contenido de conversaciones grabadas en vídeo en función 
del número de participantes. Al incrementar el número de conversadores 
encontramos un efecto sustancial sobre la capacidad de los pacientes con EA 
para seguir una conversación, pero no encontramos este efecto en sujetos 
control. Este descubrimiento no tiene gran importancia teórica, ya que la 
dificultad general para seguir una conversación tendería a incrementarse si 
aumentamos el tamaño de los participantes. Sin embargo, este resultado fue 
seleccionado en una revista para cuidadores de pacientes con EA, por ser de una 
gran relevancia práctica a la hora de organizar las visitas de los familiares de los 
pacientes con EA. 


7.6.3. ¿La conducta social es multitarea? 


Un estudio de Alderman (1969) en el que se incluyeron medidas de rendimiento 
en la doble tarea intentaba comprender por qué ciertos pacientes no obtenían 
ningún beneficio de un programa de rehabilitación para pacientes con daños 
cerebrales que sufrieran de problemas severos de conducta. Encontraron que los 
pacientes que no se habían beneficiado de la rehabilitación mostraban un 
rendimiento ligeramente inferior en una serie pruebas del lóbulo frontal, pero 
rendían consistentemente mal en una serie de medidas sobre la doble tarea. 


Más evidencias de la asociación entre las alteraciones de conducta y el deterioro 
en el rendimiento en la doble tarea provinieron de un estudio de pacientes con 
lesiones en el lóbulo frontal (Baddeley et al. , 1997). Los pacientes fueron 
examinados en la tarea de rellenar casillas y en la tarea de amplitud de dígitos 
descritas previamente. También se les examinó en dos tareas comúnmente 
asociadas a un daño en el lóbulo frontal, concretamente la tarea de fluidez 
verbal, en la que los sujetos tienen que generar ítems a partir de categorías 
semánticas, y el Test de Clasificación de Tarjetas de Wisconsin (WCS'T), en el 
que los pacientes tienen que aprender a clasificar unas tarjetas basándose en seis 
dimensiones estimulares específicas y luego cambiar cuando esa dimensión ya 
no se considere correcta. Además, los pacientes fueron evaluados de manera 
independiente respecto a la presencia de signos de un comportamiento 
disejecutivo, usando entrevistas y valoraciones de los partes médicos del 
paciente para juzgar si presentaban el déficit atencional y el comportamiento 
desinhibido a menudo asociado a un daño en el lóbulo frontal. Los pacientes 
mostraron claras evidencias de deterioro en las tres pruebas cognitivas, y cerca 
de la mitad mostraron evidencias de síntomas disejecutivos en su 
comportamiento. Estos síntomas en el comportamiento se asociaron 
significativamente con un rendimiento pobre en la doble tarea, pero no con el 
grado de deterioro en su Capacidad para ejecutar el WCST, ni en la prueba de 
fluidez verbal, cuyo deterioro fue igualmente probable tanto en pacientes 
disejecutivos como en los no disejecutivos. Parece, por tanto, que, aunque el 
deterioro del rendimiento en la tarea de fluidez verbal, así como en el WCST, 
estaban asociados, tal como esperábamos, al daño en el lóbulo frontal, el 
comportamiento disejecutivo y el rendimiento deteriorado en la doble tarea 
estaban reflejando una capacidad independiente basada en el lóbulo frontal. ¿A 
qué se puede deber esto? 


Una posibilidad es que el comportamiento social adecuado requiera de una 
capacidad para ejecutar dobles tareas, permitiendo compensar las necesidades y 
los deseos propios con los de la gente con la que estás interaccionando. También 


es igualmente posible, sin embargo, que el área de los lóbulos frontales 
implicada en el rendimiento en la doble tarea sea anatómicamente contigua al 
área responsable de una interacción social adecuada. En cualquier caso, esta 
parece ser un área de investigación interesante tanto desde el punto de vista 
teórico Como práctico. 


7.7. Conclusiones 


Recapitulando, comenzamos proponiendo un sistema de control general 
atencionalmente limitado, que llamamos ejecutivo central, basando la mayor 
parte de nuestros casos en evidencias neuropsicológicas, principalmente con 
pacientes con daños en el lóbulo frontal. A continuación, se consideraron tres 
candidatos como posibles componentes de los procesos ejecutivos. El primero, la 
capacidad para focalizar la atención como un sistema limitado, es un rasgo 
ampliamente aceptado en la mayoría de las teorías actuales sobre atención 
(Pashler, 1998). En cuanto al segundo, la capacidad para cambiar la atención, un 
examen más exhaustivo nos indicó que parecía poco probable que estuviera 
basado en un solo subproceso ejecutivo. El tercero, la capacidad para dividir la 
atención, parece más prometedor, pero de ningún modo está bien asentado. La 
cuarta función que se le adjudica al ejecutivo (Baddeley, 1996), concretamente la 
capacidad para unir la memoria a largo plazo con la memoria de trabajo, se 
discutirá en el próximo capítulo. 


Notas al pie 


* En inglés, «Wisconsin Card Sorting task». N. de la T. 


CAPÍTULO 8 


Memoria a largo plazo y búfer episódico 


De las cuatro funciones del ejecutivo central que propuse que podrían ser 
deseables, tres eran características del control atencional, en concreto, la 
capacidad para focalizar, dividir y cambiar la atención, mientras que la cuarta 
capacidad era cualitativamente diferente, concretamente la capacidad para crear 
una interfaz entre la memoria de trabajo y la memoria a largo plazo (Baddeley, 
1996). En las tres primeras capacidades está implícita la idea del ejecutivo 
central como un sistema de control atencional, lo que se hizo explícito en 
Baddeley y Logie (1999). Este enfoque se diferencia del enfoque inicial, que 
consideraba que el ejecutivo central estaba compuesto por un fondo de 
capacidad limitada con capacidades de procesamiento generales, que podían 
emplearse para distintas funciones entre las que se incluía el control atencional y 
el almacenamiento temporal. La modificación de nuestro punto de vista original 
surgió del miedo a que este concepto de procesamiento general fuera 
simplemente demasiado poderoso, con demasiadas pocas restricciones a la hora 
de generar preguntas útiles y manejables. Al tratar al ejecutivo como un sistema 
puramente atencional, se hizo algo más sencillo delimitar las cuestiones 
potencialmente fructíferas, aunque, como acabamos de ver, no significa 
necesariamente que podamos responderlas completamente en esta fase. Sin 
embargo, al desterrar el concepto de almacenamiento del ejecutivo central, cada 
vez quedaban más claros los problemas que teníamos para explicar el cuarto 
componente propuesto, es decir, cómo interactúan la memoria de trabajo y la 
memoria a largo plazo. 


8.1. Algunos enfoques reduccionistas 


Antes de comenzar con la búsqueda del vínculo entre la memoria de trabajo y la 


memoria a largo plazo deberíamos considerar una serie de enfoques alternativos 
que manejan ampliamente esta cuestión. Uno de ellos propone que la MT es 
simplemente una parte del sistema de procesamiento del lenguaje. Este enfoque 
es adoptado por investigadores cuyo interés prioritario se centra en el lenguaje, y 
quienes consideran que el almacenamiento temporal es simplemente un rasgo 
secundario de los sistemas implicados. Por tanto, en parte es una cuestión de 
dónde se centra la atención, más que de contenido. Sin embargo, este enfoque 
nos puede llevar a ignorar aquellos rasgos de la MT que no estén basados en el 
lenguaje, como en el caso de Allport (1984), que propuso que el déficit de los 
pacientes en la MCP se debía a un ligero déficit en la percepción del habla. 


8.1.1. Memoria de trabajo como procesamiento del lenguaje 


Parece muy probable que el bucle fonológico haya evolucionado a partir de 
sistemas que estaban especializados en la percepción del habla (el almacén 
fonológico) y en la producción (el sistema de repaso articulatorio). Sin embargo, 
la evidencia sugiere que el bucle proporciona un sistema separado offline para el 
almacenamiento y la manipulación de material relacionado con el lenguaje, que 
va más allá de una capacidad básica para percibir y producir el lenguaje (Vallar y 
Papagno, 2002). Esta conclusión se basa en el hecho de que, aunque el 
procesamiento del lenguaje y la MCP fonológica a menudo están deteriorados en 
pacientes con daños en el hemisferio izquierdo (Vallar et al. , 1992), el 
procesamiento del lenguaje y la MCP fonológica pueden mostrar una clara 
disociación. Por ejemplo, pacientes como P.V. que poseen una MCP fonológica 
gravemente deteriorada, pero una percepción y producción del lenguaje 
normales (Basso et al. , 1982; Martin y Breedin, 1992). Por el contrario, hay 
pacientes con una MCP verbal relativamente bien preservada, pero con un 
importante déficit en la percepción auditiva (Baddeley y Wilson, 1993a). Es más, 
incluso si estos enfoques periféricos de la memoria de trabajo pudieran dar 
cuenta en principio de la MCP fonológica, no nos dicen nada acerca de la 
capacidad crucial de este sistema para servir como memoria de trabajo, ni de la 
capacidad para manipular la información y solucionar problemas, ni siquiera de 
su Capacidad para servir de interfaz con la MLP. Por supuesto, no voy en contra 
de las explicaciones más complejas sobre la memoria de trabajo que acentúan el 
procesamiento del lenguaje, y las cuales yo consideraría como variantes de un 


modelo multicomponente (e.g., N. Martin). Estos enfoques se diferencian del 
mío en que se centran en pacientes que posiblemente poseen un déficit del 
lenguaje relativamente complejo, en vez de buscar casos con un déficit aislado 
para un componente específico: en este caso, en el bucle fonológico. Ambos 
modos de teorizar tienden a aceptar la necesidad de asumir algún tipo de 
almacenamiento temporal dentro de la memoria de trabajo multicomponente. 


8.1.2. Memoria de trabajo como memoria a largo plazo activada 


Un enfoque más ampliamente aceptado es que la MT representa simplemente los 
componentes de la MLP que están activos en ese momento. Este era por 
supuesto el enfoque dominante en Norteamérica hacia finales de los años sesenta 
(e.g., Melton, 1963), y fue propuesto más recientemente por Nairne (2002) y por 
Ruchkin et al. (2003). Mi crítica a este enfoque no es que sea incorrecto, sino 
que parece que responde con claridad cuando en realidad no es así (Baddeley, 
2003a). La MT depende ciertamente de la MLP, pero de tantas maneras distintas 
que es completamente inútil hacer una simple identificación de la MT con una 
MLP activada. Un enfoque como este podría, por ejemplo, insinuar 
razonablemente que si uno comprende la MLP, entonces tendría que comprender 
la MT. Y existen pocas evidencias de esto. Aunque sí sabemos bastante más de 
la MT de lo que sabíamos hace 30 años, yo creo que casi todo es consecuencia 
de concebir este sistema como un sistema separado de la MLP. 


Los defensores de un sistema de memoria unitario se han basado a menudo en 
las demostraciones de las analogías entre la MT y la MLP, una aproximación que 
comenzó con el clásico ataque de Melton (1963) al concepto de la MCP, 
secundado por Postman (1975) y más recientemente por Nairne (2002) y 
Ruchkin et al. (2003). Estas analogías se basan casi siempre en paradigmas 
experimentales que incluyen componentes a largo y corto plazo. No es 
sorprendente, por tanto, que estos paradigmas híbridos muestren explícitas 
similitudes en las tareas a largo plazo. Algunos ejemplos de estas tareas son la 
tarea del olvido a corto plazo de Peterson, el recuerdo libre y la amplitud de 
memoria en funcionamiento. Sin embargo, las similitudes no implican identidad; 
el hecho de que los lagartos y los elefantes tengan cuatro patas, dos ojos, una 
boca y no tengan pelo no significa que sean de la misma especie. Este tema ya se 


ha tratado en relación a la defensa que hace Nairne (2002) de un sistema de 
memoria unitario, y por tanto no se discutirá más. 


Aunque me resisto a pensar que la MT sea simplemente una parte de la MLP, sí 
estoy de acuerdo, sin embargo, en que existen muchas formas diferentes de 
interacción entre la MT y la MLP. Si consideramos por ejemplo al bucle 
fonológico, está claro que las no palabras son más fáciles de recordar si se 
asemejan a las palabras y si son fonotácticamente similares en su estructura a la 
lengua nativa del sujeto (Baddeley, 1971; Gathercole et al. , 2001). Por tanto, 
una no palabra como monage es más fácil de recordar que luzok, a pesar de que 
ninguna de las dos es familiar ni tiene significado. Una influencia más explícita 
del conocimiento a largo plazo puede, por supuesto, repercutir en el rendimiento, 
lo que explica por qué presumiblemente los sujetos de los experimentos sobre 
amplitud de dígitos nunca responden con otra cosa que no sean dígitos. El 
conocimiento semántico a nivel de palabras individuales, conceptos y 
conocimiento general del mundo también influye en el recuerdo inmediato 
verbal, probablemente basándose, una vez más, tanto en procesos implícitos 
como explícitos. 


Estoy de acuerdo, por tanto, en que la memoria de trabajo implica una MLP 
activada desde distintas maneras, lo mismo que sucede con muchos aspectos de 
la cognición humana. Por ejemplo, la percepción también implica una MLP 
activada; tendemos a ver el mundo en términos de mesas, sillas y atardeceres, y 
no como rasgos puramente sensoriales. Estas uniones con la experiencia previa 
son, por supuesto, importantes, pero no llevarían a sugerirnos que la percepción, 
o incluso algo que dependa más fuertemente del aprendizaje, como el lenguaje, 
son simplemente una MLP activada. Por tanto, admitiendo que la indiscutible 
unión entre MT y MLP supone un problema, o probablemente una serie de 
problemas, en vez de una solución, ¿qué más se puede decir sobre esto? 


8.2. Cadáveres en el armario de la memoria de trabajo 


Nuestra decisión de postular un ejecutivo central desprovisto de una capacidad 
de memoria dio origen a una serie de problemas. Inicialmente preferí dejar a un 
lado estas dificultades y considerarlas a su debido tiempo. Aunque consideré que 


estas cuestiones simplemente podía «dejarlas para mañana», una metáfora más 
adecuada, dada la amenaza potencial para adecuarlas a nuestro modelo de MT, 
podría ser «guardar los cadáveres en el armario». Eventualmente, hemos 
intentado poner demasiados cadáveres en el armario y se nos han terminado 
cayendo, subrayando la necesidad de reformular la estructura fundamental de la 
MT. Los problemas se pueden enmarcar dentro de tres categorías: (1) La 
evidencia de un almacenamiento de la información a corto plazo, que no puede 
explicarse fácilmente con el bucle fonológico o con la agenda; (2) El problema 
de cómo interaccionarían el sistema visoespacial y el fonológico, y (3) El 
problema, aún sin resolver, de la interfaz entre la MT y la MLP. A continuación 
se irán discutiendo uno por uno. 


8.2.1. ¿Un almacén de seguridad para la MCP? 


Hemos estado tratando al bucle fonológico como si fuera el único recurso para el 
rendimiento en la amplitud de dígitos. Si este fuera el caso, entonces, bajo 
condiciones de supresión articulatoria y presentación visual, la amplitud debería 
descender casi hasta cero. De hecho, la amplitud cae típicamente desde seis o 
siete dígitos hasta cuatro o cinco (e.g., Larsen y Baddeley, 2003b), lo que sugiere 
la necesidad de asumir algún tipo de almacén «de seguridad» adicional (Page y 
Norris, 1998). ¿Podría estar reflejando esto la contribución de la MLP a la 
amplitud? Si es así, los pacientes con un déficit puro en la MCP fonológica, pero 
con una MLP normal, tendrían amplitudes de cuatro o cinco dígitos, y no de uno 
o dos ítems, como típicamente se ha comprobado (Vallar y Shallice, 1990b). 


8.2.2. Recuerdo preservado en pacientes de MCP 


Cuando los pacientes de MCP recuerdan dígitos presentados auditivamente, su 
amplitud suele rondar un solo ítem. Cuando la presentación es visual la amplitud 
aumenta hasta cuatro dígitos (Shallice y Warrington, 1970; Basso et al. , 1982). 
Una explicación obvia para este dilema consiste en atribuir el incremento de la 
amplitud a la agenda visoespacial. Sin embargo, se ha asumido típicamente que 


la agenda mantiene la información en paralelo, y es inapropiada para el recuerdo 
serial. En una serie de estudios llevados a cabo por Phillips se usaron modelos 
matriciales en los que solo el ítem final se mantenía en la MCP (Phillips y 
Christie, 1977). Una posible solución es formular un sistema adicional, basado 
posiblemente en el léxico, que esté especializado en el recuerdo serial. Sin 
embargo, aunque existe buena evidencia de la retención de las características 
visuales de secuencias codificadas verbalmente (ver Logie et al. [2000], para una 
revisión), no está muy claro si se mantiene, ni cómo se mantiene, el orden 
secuencial de los ítems que no se pueden codificar verbalmente (ver el Capítulo 
4, para una discusión más detallada de este tema). 


8.2.3. Codificación semántica en la MCP 


Aunque mi estudio inicial mostraba que el recuerdo serial inmediato de 
secuencias de cinco palabras reflejaba principalmente una codificación 
fonológica, también se encontró un efecto pequeño, pero significativo, de una 
codificación semántica (Baddeley, 1966a). Otros estudios han demostrado 
efectos semánticos mucho más poderosos (e.g., Brener, 1940; Hulme, Roodenrys 
et al. , 1997). Los factores semánticos tienden a verse más influidos cuando se 
incrementa la dificultad para retener los ítems, en vez de la información sobre el 
orden, usando por ejemplo secuencias más largas o series de ítems potenciales 
más largas. El hecho de que los factores semánticos contribuyeran en los 
paradigmas de la MCP no era un problema para el modelo inicial de memoria de 
trabajo de Baddeley y Hitch. Sin embargo, sí se convirtió en un problema una 
vez que el ejecutivo fue despojado de su capacidad como almacén, dejando 
abierta la cuestión de cómo se almacenaban estos códigos fonológicos y 
semánticos y cómo se combinaban para acentuar el recuerdo. 


8.2.4, Amplitud de frase 


Normalmente la memoria inmediata para frases es mayor que la amplitud para 
palabras inconexas (Brener, 1940). Baddeley et al. (1987) encontraron una 


amplitud en torno a cinco para palabras inconexas, y en torno a 15 para las 
frases. ¿Se podría sugerir, por tanto, que la MLP proporciona una amplitud de 10 
palabras y la MT una amplitud de cinco? Entonces, suponed que examinamos a 
un paciente con un déficit en la MCP fonológica cuya amplitud para palabras 
inconexas es de un ítem, pero que posee una MLP normal; ¿qué podríamos 
esperar? Su amplitud para frases estaría presumiblemente rondando las once 
palabras, diez gracias a la MLP y una palabra gracias a la MCP. Se observó una 
amplitud de cinco palabras (Baddeley et al. , 1987). Esto sugiere un proceso 
interactivo por el cual un núcleo fonológico básico se ve ampliado gracias a la 
contribución de la MLP. Si la amplitud básica se ve fuertemente reducida, 
entonces el rendimiento general también estará severamente limitado. 


Este enfoque es ampliamente consistente con el trabajo reciente de Gathercole 
(sin publicar) que sugiere que, en general, la amplitud de memoria depende del 
almacenamiento fonológico de la información a un nivel silábico o a un nivel 
por debajo de las sílabas, y luego es interpretada mediante procesos 
redintegrativos. Sin embargo, como se observó anteriormente, el modelo de MT 
actual no se ha pronunciado sobre cómo podrían operar estos procesos 
exactamente, ni siquiera sobre dónde se podrían almacenar los productos 
intermedios durante la redintegración. 


8.2.5. Recuerdo de prosa 


Los temas suscitados por la amplitud de frase se ven agudizados, si cabe, cuando 
consideramos el recuerdo de pasajes en prosa compuestos por uno o más 
párrafos. Este tema fue observado de manera particularmente clara en K.J., un 
paciente muy inteligente con una profunda amnesia muy pura (Wilson y 
Baddeley, 1988). Cuando se le pedía que recordara un párrafo perteneciente a la 
prueba de recuerdo de prosa de la Escala de Memoria de Wechsler, su 
rendimiento inmediato fue normal, pero 20 minutos después, fue incapaz de 
recordar absolutamente nada. Esta ausencia de recuerdo demorado era esperable, 
pero, ¿cómo se las ingenió para rendir tan bien en la prueba inmediata? El pasaje 
en cuestión consistía en una breve historia de estilo periodístico sobre una señora 
que pierde su pulsera y recibe ayuda de la policía; la historia estaba compuesta 
por unas 20 «ideas centrales», cada una formada por varias palabras largas. Esto 


sobrepasa sustancialmente la capacidad del bucle fonológico; tampoco era 
plausible pensar que esta cantidad de detalles pudiera ser almacenada en la 
agenda. Por tanto, ¿cómo pudo lograr un rendimiento tan bueno? 


Por suerte, la prueba de recuerdo de prosa se incluía como parte de una batería 
clínica rutinaria que mi colega, Bárbara Wilson, había utilizado durante muchos 
años en pacientes con un déficit de memoria. Por tanto, decidimos ver cómo de 
típico era el rendimiento mostrado por K.J., y si, como razonablemente 
asegurábamos, demostraba ser atípico, intentar evaluar qué era lo que le permitía 
rendir tan bien (Baddeley y Wilson, 2002). Por supuesto, tal como esperábamos, 
todos los pacientes amnésicos rindieron mal en el recuerdo demorado. 
Encontramos también que la mayoría de los pacientes amnésicos rendían 
relativamente mal en el recuerdo inmediato. Sin embargo, había un pequeño 
número de pacientes como K.J. cuyo nivel de rendimiento en el recuerdo 
inmediato variaba en un rango de moderado a excelente. Cuando examinamos su 
perfil clínico, destacaron dos características; tendían a tener un alto nivel de 
inteligencia medida a través de la Escala de inteligencia Wechsler para Adultos, 
y en la mayoría de los casos tenían capacidades ejecutivas bien preservadas, dos 
características que no sorprende que tiendan a correlacionar. 


Interpretamos estos resultados de la siguiente manera. Asumimos que 
comprender un pasaje coherente en prosa implica activar y combinar 
representaciones dentro de la MLP. Estas representaciones varían, desde el 
significado de palabras individuales, pasando por conceptos, y llegando en un 
nivel superior, a estructuras como la gramática de historias y los guiones que 
reflejan un conocimiento social compartido (Kintsch y van Dyck, 1977; Schank 
y Abelson, 1977). En sujetos con una memoria episódica normal, asumimos que 
estas estructuras se consolidarán dentro de la MLP, logrando formar la base de la 
recuperación tras una demora. Sin embargo, los pacientes con una MLP 
episódica defectuosa, independientemente de lo bien que se construya y se 
mantenga en la MT la estructura que representa el pasaje, la huella no se 
consolidará y, por tanto, no lo recordarán después de una breve demora rellena. 


Nuestro segundo supuesto es que, mientras que la tarea de construir una 
representación general del párrafo en la MT puede ser relativamente directa si se 
posee una memoria episódica normal, en ausencia de ella, se convierte en una 
tarea con una alta demanda atencional, que requiere un mantenimiento activo 
constante y una actualización de la estructura de memoria para evitar que se 
colapse. Los pacientes amnésicos que son capaces y están dispuestos a hacer 


esto pueden demostrar un recuerdo inmediato bueno, pero, sin embargo, siguen 
siendo incapaces de almacenar a largo plazo y de recuperar información de la 
historia. Endel Tulving (comunicación personal, 1999) me describió un ejemplo 
particularmente insólito sobre la capacidad de mantener información en la MT a 
lo largo del tiempo, incluso con una profunda amnesia. El paciente en cuestión 
manifestaba seguir siendo capaz de jugar al bridge, a pesar de su profunda 
amnesia. Tulving decidió ponerlo a prueba iniciando una jugada. El paciente no 
solo fue capaz de llevar la cuenta de las apuestas y de los triunfos en cada baza, 
sino que también fue capaz de recordar las cartas que ya se habían tirado con 
suficiente destreza como para permitirle a él y a su compañero ganar la partida. 


Nuestra interpretación sobre el recuerdo preservado de prosa a pesar de la 
amnesia, tiene considerables similitudes con el concepto de memoria de trabajo a 
largo plazo que exponen Ericsson y Kintsch (1995). Sin embargo, se diferencia 
en que acentúa la naturaleza temporal de las estructuras de recuperación 
construidas por nuestros pacientes amnésicos, mientras que Ericsson y Kintsch 
ponen más énfasis en el desarrollo previo, dentro de la MLP, de las estructuras 
de recuperación necesarias, tal como ocurre, por ejemplo, con los sujetos que 
son capaces de demostrar un recuerdo inmediato considerable tan solo gracias a 
las muchas horas de práctica que emplean construyendo las estructuras 
necesarias en su MLP. Como veremos más adelante, yo también asumo un papel 
más activo y flexible para la memoria de trabajo, además del uso de las 
estructuras activadas y de las representaciones dentro de la MLP que asumen 
Ericsson y Kintsch. 


8.2.6. Agrupamiento en segmentos [Chunking] 


Quizá la observación más poderosa acerca del funcionamiento de la MCP es la 
demostración de Miller (1956) de la importancia del agrupamiento en 
segmentos, que permite una mayor amplitud de memoria al combinar varios 
ítems en un solo segmento integrado. La ventaja del recuerdo de prosa frente al 
recuerdo de palabras no relacionadas reside presumiblemente en la capacidad de 
los sujetos para combinar palabras individuales dentro del material de prosa, 
formando así segmentos con significado. La sugerencia de Miller de que nuestra 
capacidad para procesar información puede venir determinada por el número de 


segmentos más que por el número de ítems, sigue siendo influyente, aunque la 
opinión actual tiende a apoyar una capacidad cercana a cuatro y no al mágico 
número siete de Miller (Cowan, 2001; 2005). 


En el modelo de MT inicial, la agrupación en segmentos fue asignada de forma 
implícita a las capacidades de procesamiento y de almacenamiento del ejecutivo 
central. Sin embargo, dada su nueva versión abreviada, sin capacidad de 
almacenamiento, el ejecutivo parece mal equipado para ejecutar esta importante 
tarea. ¿Se podría asignar el agrupamiento a la MLP? Ya que K.J., nuestro 
paciente profundamente amnésico, parece ser capaz de agrupar adecuadamente, 
como muestra su capacidad para el recuerdo inmediato de prosa, esto parecería 
sugerir que la segmentación no depende de una MLP episódica intacta. Más aún, 
él parece ser capaz de utilizar algún sistema o proceso para mantener las 
representaciones segmentadas a lo largo de demoras cortas. Finalmente, la gran 
flexibilidad que tenemos para combinar la información en segmentos parece 
sugerir que el proceso va más allá de la simple activación simultánea de las 
estructuras existentes en la MLP. 


8.2.7. Amplitud de memoria de trabajo 


Como veremos en el Capítulo 10, uno de los rasgos más investigados de la 
memoria de trabajo tiene que ver con las diferencias individuales en su 
capacidad general. En un estudio clásico, Daneman y Carpenter (1980) pidieron 
a Sus sujetos que procesaran una serie de frases y, después, que recordaran la 
última palabra de cada frase. Midieron el número máximo de frases que se 
podían procesar y recordar de esta manera, y lo llamaron amplitud de memoria 
de trabajo. Demostraron una correlación sustancial entre la amplitud y la 
comprensión lectora en estudiantes universitarios, mientras que estudios 
posteriores han demostrado que predice el rendimiento en una amplia serie de 
tareas cognitivas, incluyendo medidas de inteligencia general, y habilidades 
cognitivas prácticas como aprender a programar o comprender la electrónica 
(Kyllonen y Christal, 1990; Daneman y Merikle, 1996; Engle et al. , 1999). De 
nuevo, esta tarea demanda claramente procesos de almacenamiento que exceden 
a la capacidad de los subsistemas verbales y visoespaciales. La amplitud de 
memoria de trabajo también predice el funcionamiento cognitivo con mucha más 


eficacia que las sencillas medidas de amplitud de palabras o las de MLP 
episódica (ver el Capítulo 11). La cuestión que surge, una vez más, es cómo 
explica la versión de MT de Baddeley y Logie estos importantes resultados. 


8.2.8. Conciencia 


Como se discute en la sección acerca de las imágenes, Baddeley y Andrade 
(2000) intentaron dar cuenta de los procesos que subyacen a la conciencia de 
imágenes visoespaciales y auditivas puramente en términos de los subsistemas 
visoespaciales y fonológicos. Aunque nuestros resultados indicaban que estos 
subsistemas formaban posiblemente un parte de la historia, particularmente para 
estímulos nuevos recién codificados, teníamos dificultades para utilizarlos como 
una explicación para las imágenes basadas en la MLP. Aunque la MT estaba 
claramente implicada, la aparente contribución del bucle y de la agenda a las 
imágenes que se derivan de la MLP era más bien modesta. Nuestra 
interpretación revisada de estos resultados implicaba combinar la información de 
la MLP y la información de los subsistemas relevantes de la MT, pero dejaba 
completamente sin especificar cómo se integraba esta información (Baddeley y 
Andrade, 2000). Parece que necesitamos una capacidad atencional, ya que una 
tarea secundaria demandante tendía a reducir las estimaciones de viveza de todo 
tipo de imágenes, aunque no sabemos cuál podría ser este sistema. 


El problema de integrar información procedente de más de una fuente también 
aparece en otros procedimientos más tradicionales. Por ejemplo, Logie et al. 
(2000) eran capaces de demostrar efectos de similitud visual en el recuerdo serial 
inmediato de consonantes. Los efectos visuales eran pequeños comparados con 
los efectos fonológicos, pero eran fiables, pues aparecían con supresión y sin 
supresión articulatoria y a lo largo de todas las posiciones seriales. Estos 
resultados revelan algún punto común en el que la información visual y la verbal 
pueden interaccionar. 


Resumiendo, aunque el modelo simple de Baddeley y Hitch (1974) es capaz de 
dar cuenta de una gran cantidad de datos, el intento de restringir su Capacidad de 
almacenamiento a los subsistemas visoespaciales y verbales ha creado una serie 
de problemas significativos. Esto parece sugerir que la capacidad que tiene la 


MT para almacenar información excede a la capacidad de los subsistemas 
existentes. También necesitamos un mecanismo que permita que los subsistemas 
verbal y visoespacial interaccionen uno con el otro, y con la MLP. Finalmente, el 
sistema parece estar relacionado con la conciencia y parece estar 
atencionalmente limitado. 


En respuesta a estos problemas, yo propuse el concepto de búfer episódico, 
identificándolo como el cuarto componente de la memoria de trabajo (Baddeley, 
2000). En retrospectiva, se podría considerar igualmente como el 
fraccionamiento del ejecutivo central inicial, en un componente de control 
atencional, tal como propusieron Baddeley y Logie (1999), y en un componente 
de almacenamiento adicional. Esta concepción tiene la ventaja de que es clara, 
ya que el bucle y la agenda también se pueden separar en componentes de 
procesamiento y de almacenamiento. Sin embargo, el inconveniente de esta 
propuesta es que puede sugerir una similitud mayor de la que realmente hay. Por 
tanto, para propósitos presentes, trataremos el búfer episódico como un 
subsistema separado, como muestra la Fig. 8.1. 


Ejculivo 


centra 


Fig. 8.1. El modelo revisado de memoria de trabajo propuesto por Baddeley 
(2000). Incluye una representación de las uniones con la memoria a largo plazo, 
e incluye un cuarto componente, el búfer episódico. En su versión inicial, las 
uniones entre los subsistemas y el búfer operaban a través del ejecutivo central. 
Ahora parece probable que también haya uniones directas (representadas aquí 
por líneas discontinuas). De Baddeley, A. D. (2000). El búfer episódico: ¿un 
componente nuevo de la memoria de trabajo? En: Trends in Cognitive Sciences 
4(11), 417-423. Reproducido con el permiso de Elsevier. 


8.3. El búfer episódico 


Comenzaré intentando justificar el nombre, ya que este es el que logró que se 
cristalizaran mis pensamientos algo incipientes sobre la necesidad de un 
componente adicional de la MT. El sistema es episódico en el sentido de que 
integra información en episodios coherentes; es un búfer en cuanto a que 
comprende un sistema de almacenamiento de capacidad limitada que permite 
que la información codificada interaccione usando distintas dimensiones. Su 
capacidad se establece en términos de unidades de información [ chunks], 
considerando una unidad como un paquete de información enlazada por fuertes 
uniones asociativas dentro de la unidad, y por uniones relativamente débiles 
entre unas unidades y otras. Un rasgo central del búfer es, por tanto, su papel en 
la combinación de información desde diversas fuentes en segmentos de 
información unificados. 


Hummel (1999) distingue entre combinaciones estáticas y dinámicas. La 
combinación estática se da cuando dos rasgos coocurren; un ejemplo perceptivo 
sería el amarillo y los plátanos. Observar de forma repetida el amarillo y los 
plátanos podría llevar a una combinación de los mismos en la memoria 
semántica. Esta combinación se podría basar, bien en la estructura básica del 
sistema perceptivo subyacente, o bien en el aprendizaje. Los principios 
gestálticos ofrecen algunos ejemplos de factores estructurales que facilitan la 
combinación perceptiva, como, por ejemplo, la continuidad y el cerramiento, los 
cuales ayudan a descomponer el conjunto visual en objetos y en escenas. La 


combinación basada en el aprendizaje se da cuando el conocimiento a largo 
plazo nos ayuda a agrupar en unidades de información objetos familiares 
presentes en escenas complejas, como un coche aparcado frente a una casa. En 
ambos casos la combinación se daría con un coste atencional comparativamente 
pequeño. La combinación dinámica implica una nueva mezcla de ítems que se 
podrían combinar de muchas maneras diferentes, incluyendo de manera 
potencial la integración de una serie aparentemente arbitraria de objetos y 
rasgos, por ejemplo, un plátano rojo flotando en un lago de papilla azul. Hummel 
sugiere que esta combinación dinámica supone una demanda computacional 
considerablemente mayor para el sistema. Este tema se tratará en el próximo 
capítulo. 


Recapitulando. Se supone que el búfer episódico es un sistema de 
almacenamiento temporal capaz de mezclar información procedente del bucle, la 
agenda, la memoria a largo plazo, o incluso del input perceptivo, en un episodio 
coherente. Este proceso puede ser atencionalmente demandante, mientras que 
una recuperación directa desde la MLP se supone que es relativamente poco 
demandante (Baddeley et al. , 1984b; Crack et al. , 1996). Como se muestra en la 
Fig. 8.1 (ver p. 180), el búfer proporciona una unión entre el ejecutivo y la MLP. 
En la versión inicial (Baddeley, 2000), el flujo de información desde el bucle 
fonológico y desde la agenda visoespacial se da a través del ejecutivo. No supuse 
una unión directa con estos subsistemas, prefiriendo dejar esta cuestión abierta a 
la investigación empírica. Como se muestra en el siguiente capítulo, la evidencia 
tiende a favorecer esta unión. 


Se asume que el búfer episódico es la base de la conciencia. Una serie de 
teóricos han sugerido que la principal función de la conciencia es combinar 
información reunida a partir de canales perceptivos separados, como el color, la 
forma y la localización, en objetos coherentes (Baars, 1997; Dehaene y 
Naccache, 2001). El carácter reflexivo de la conciencia, el hecho de que seamos 
conscientes de nuestra experiencia y esto se vea reflejado implica un sistema que 
dispone de procesos de almacenamiento temporal así como manipulativos. 
Ambos están, por supuesto, en el corazón del concepto de MT. Estos temas se 
discutirán con detalle en el Capítulo 16. 


Una posible crítica a mi concepto de búfer episódico es que simplemente estoy 
reemplazando un armario repleto de esqueletos con un solo fantasma etéreo. 

Propongo tres métodos por los cuales mi posible aparición podría reencarmarse. 
El primero consiste en repasar los problemas descritos, explicando por qué creo 


que el búfer episódico ofrece una posible solución. El segundo es aplicar el 
concepto a una serie de cuestiones que Miyake y Shah (1999b) proponen como 
centrales en cualquier modelo de memoria de trabajo. El tercero es intentar usar 
el concepto de búfer episódico como marco de trabajo para los estudios 
empíricos. Si demuestra ser Capaz de generar experimentos fructíferos que nos 
ayuden a comprender mejor los procesos y los sistemas de memoria de trabajo, 
entonces lo habré conseguido, incluso si los resultados hallados nos llevan a una 
modificación sustancial del concepto inicial, o incluso a abandonarlo. En 
resumen, el búfer episódico es una herramienta conceptual, no un modelo 
específico. Por supuesto, ninguna de estas tres estrategias se podrían considerar 
intrínsecamente capaces de demostrar la validez del búfer episódico. Lo que sí 
pueden hacer, espero, es ilustrar su posible valor heurístico como método para 
tratar la ignorada cuestión acerca de cómo se integran los subsistemas de la 
memoria de trabajo y su interfaz con la MLP. 


8.3.1. Enterrando los cadáveres 


¿De qué forma podría contribuir el concepto de búfer episódico a explicar 
nuestros nueve problemas? A continuación se resumen los posibles 
acercamientos a cada uno de estos problemas: 


1. El almacén de reserva. El búfer episódico ofrece un complemento a la 
capacidad limitada del bucle fonológico, utilizando un código multimodal para 
proporcionar una capacidad de almacenamiento adicional. 


2. Pacientes de MCP. Muestran un rendimiento gravemente deteriorado solo 
cuando la presentación es auditiva, lo que obliga a que la información entre en el 
búfer episódico a través del almacén fonológico deteriorado. Cuando la 
presentación es visual, se dispone de una vía de acceso al búfer más adecuada. 


3. Codificación semántica en la MCP. Gracias a su capacidad de unión con la 
MLP y a que proporciona una codificación multidimensional, el bucle 
fonológico puede sacar provecho de la información semántica. Esto puede ser 
innecesario en secuencias cortas, pero se vuelve cada vez más valioso en 


secuencias largas y en secuencias en las que la información del ítem es crucial. 


4. El almacén multidimensional del búfer episódico. Podemos asumir 
plausiblemente que es capaz de almacenar en orden serial de una forma que no 
es accesible por la agenda. 


5. Recuerdo de frases y de material en prosa. El incremento en la amplitud es 
resultado de la capacidad del búfer para usar e integrar información, tanto de los 
subsistemas de la MT como de la MLP, permitiendo el incremento de la 
amplitud mediante la agrupación en segmentos de información. 


6. Agrupamiento en segmentos [chunking]. Se supone que el agrupamiento 
activo de ítems que no estaban previamente relacionados tiene lugar dentro del 
búfer episódico, empleando la capacidad atencional del ejecutivo para sacar 
provecho del aprendizaje previo y para combinar de manera novedosa la 
información procedente de fuentes separadas. 


7. Redintegración. Se supone que es un proceso por el que el ejecutivo se 
aprovecha de la información disponible en la MLP para interpretar de forma 
óptima el contenido del búfer episódico. Sin embargo, es posible que haya otros 
procesos más automáticos por los cuales el conocimiento a largo plazo facilite 
tanto el agrupamiento en segmentos como la recuperación desde la MLP. 


8. La amplitud de la memoria de trabajo. Se supone que refleja la capacidad de 
almacenamiento del búfer, junto con la eficacia con la que el ejecutivo puede 
emplear esta capacidad. 


9. Conciencia. Proporciona un modo de recuperar la información desde el búfer. 
Es particularmente efectiva, permitiendo que múltiples fuentes de información se 
puedan procesar en paralelo (ver Capítulo 16). 


8.3.2. ¿Cómo funcionaría el búfer? 


A estas alturas es totalmente inapropiado esperar un modelo preciso y detallado. 
Lo que sigue, por tanto, deberíamos considerarlo como una base para generar 
posibles hipótesis acerca de la forma en que la información procedente de la 


MLP se mantendría y se manipularía en la MT. Consisten esencialmente en 
tentativas cuyo propósito es facilitar la investigación de un área importante 
aunque ignorada, y no firmes predicciones cuyo incumplimiento nos obligaría a 
desestimar todo el modelo. Como marco de trabajo adecuado usaré de nuevo las 
cuestiones de Miyake y Shah (1999b). Estas cuestiones y las respuestas que 
propongo son las siguientes: 


8.3.3. Mecanismos básicos y representaciones 


Estos se desglosan en una serie de preguntas. 


1. ¿Cómo se codifica y se mantiene la información? Inicialmente adopté como 
hipótesis de trabajo que la codificación de la información dependería 
fuertemente del funcionamiento del ejecutivo central, que podría funcionar a 
través del bucle fonológico, la agenda o la MLP, y que se mantendría gracias al 
repaso. Aunque puede que el componente fonológico se mantenga gracias al 
repaso subvocal, sospecho que de todos los tipos de repaso, este es un tanto 
atípico. Mientras que el código fonológico se puede regenerar literalmente, este 
no es el caso del código visual, y sospecho que tampoco el del semántico. Por 
tanto, parece probable que el repaso dentro del búfer sea algo más parecido a una 
atención continua sobre una representación particular. 


2. ¿Cuál es el mecanismo de recuperación? Yo consideraría que la conciencia es 
el principal modo de recuperación, aunque es el modo del que menos seguro me 
encuentro. Si consideramos la instrucción siguiente: «presione el botón de la 
mano derecha cuando aparezca la luz roja». Este parece ser un caso en el que 
podemos establecer claramente un «programa» temporal que nos permita 
ejecutar esta operación. ¿Este programa se mantiene en el búfer episódico o en 
algún otro sistema paralelo? Si se mantiene en el búfer, sospecho que no es 
necesario ser consciente de la instrucción para poder obedecerla. Sin embargo, 
hasta el momento, sabemos muy poco acerca de esta capacidad tan importante 
(Monsell, 1996), por lo que sugerir que estos programas temporales se 
almacenan en el búfer ofrece al menos una hipótesis de partida potencialmente 
útil. 


3. ¿Cómo se representa la información: el formato es diferente para los distintos 
tipos de información? Asumo un solo código multidimensional que proporciona 
una interfaz para la información procedente de muchas fuentes distintas. Entre 
estas fuentes se incluyen probablemente la MLP y los subsistemas de la MT, 
junto con información procedente de los sistemas sensoriales, incluyendo los del 
olfato y el gusto, que por sí mismos no tienen medios para el control y la 
manipulación. Una vez más, este es un supuesto altamente especulativo que al 
menos posee la ventaja de que anima a considerar un área intrigante, aunque 
relativamente desconocida. 


8.3.4. Control y regulación 


1. ¿Cómo se controla y regula la información? Supongo que el control depende 
de los sistemas que se alimentan del búfer, así como del ejecutivo central. Por 
tanto, la información fonológica estaría controlada en parte por el proceso de 
repaso subvocal, mientras que la información de la MLP estaría más 
sustancialmente influida por los hábitos y la experiencia. Sin embargo, el flujo 
de la información vendría determinado por el componente supervisor del 
ejecutivo central, que a su vez estaría influido por objetivos de niveles 
superiores. 


2. ¿Qué determina qué información se almacena y cuál se ignora? Tanto los 
hábitos existentes como los objetivos de niveles superiores determinan el flujo 
de la información, tal como se discutirá en los próximos capítulos. 


3. ¿Está el control manipulado por una estructura central? Sí, por el ejecutivo 
central, aunque aún está por aclarar si esto representa una estructura jerárquica 
única con un controlador básico o una alianza de niveles heterárquicos formados 
por múltiples procesos ejecutivos. En los próximos capítulos se discute cómo 
podría funcionar este sistema. 


8.3.5. ¿El búfer episódico es unitario o no unitario? 


1. ¿Está formado por múltiples subsistemas independientes? Teóricamente en 
este momento, se considera que el búfer es un subsistema unitario dentro de la 
memoria de trabajo multicomponente. Como resultado de una exploración 
empírica, parece probable que el búfer se pueda fraccionar, como ha ocurrido 
con el bucle y con la agenda. 


8.3.6. La naturaleza de las limitaciones del búfer 


1. ¿Qué mecanismos restringen la capacidad? La capacidad se encuentra 
limitada de diferentes maneras. En primer lugar, el búfer estará restringido por el 
hecho de que sus fuentes de información, en concreto la MLP y los distintos 
subsistemas, están en sí mismos limitados. El búfer está limitado en cuanto a la 
cantidad de unidades de información que puede mantener (Cowan, 2005) y en 
cuanto a la eficacia con la que el ejecutivo central puede hacerlo funcionar. 


En un nivel más neurobiológico, estos límites tenderán a reflejar en sí mismos 
una serie de parámetros, entre los que se incluyen medidas de excitación e 
inhibición, tasas de desvanecimiento dentro de los almacenes relevantes y 
efectos de interferencia que dependen del carácter concreto del material 
almacenado. Aunque debe haber similitudes entre los mecanismos que operan 
dentro de los diversos subsistemas que se alimentan del búfer episódico, es 
difícil que estos mecanismos sean idénticos, debido a las distintas restricciones 
impuestas por la necesidad de procesar el sonido, la visión y el significado. 


8.3.7. El papel del búfer en las actividades cognitivas complejas 


1. ¿Un papel en la comprensión del lenguaje? Supongo que el búfer juega un 
papel en la comprensión de episodios complejos, aunque no está claro hasta qué 
punto está fuertemente involucrado en la comprensión rutinaria (ver más abajo). 
Es posible que casi todo el acceso a las representaciones de la memoria a largo 
plazo sea relativamente automático, dado que la recuperación a partir de la MLP 
no parece depender fuertemente de la capacidad de memoria de trabajo 


(Baddeley et al. , 1984; Craik et al. , 1996). 


2. ¿Pensamiento espacial? Creo que el búfer episódico ofrece un espacio de 
trabajo cognitivo, y por tanto juega un papel central en el pensamiento espacial, 
respaldado por la agenda visoespacial. Supongo que se podría aplicar lo mismo a 
otra serie de actividades de resolución de problemas, aunque el énfasis se 
pondría en otros subsistemas distintos a la agenda. En concreto, el acceso 
flexible a la MLP y la capacidad para captar y utilizar analogías a través de 
distintos contextos y modalidades parece ser algo importante. El rendimiento 
estará influenciado por el número de unidades de información que se puedan 
mantener y por la capacidad atencional del ejecutivo central. Volveré a este tema 
en el próximo capítulo. 


8.3.8. Las relaciones del búfer con la MLP y con el conocimiento 


1. Relación con la MLP episódica. El búfer episódico es el principal vínculo 
entre la memoria de trabajo y la MLP. Se parece a la MLP episódica en que se 
encarga de integrar y mantener episodios individuales específicos. Pero se 
diferencia, sin embargo, en que este mantenimiento es temporal y está limitado 
atencionalmente. Se supone que la entrada del material nuevo en la memoria a 
largo plazo episódica depende del búfer, el cual se supone que también juega un 
papel importante en la recuperación episódica. Sin embargo, el búfer podría estar 
bien preservado en pacientes profundamente amnésicos, pero, por el contrario, 
podría verse interrumpido en pacientes con una MLP intacta. Por supuesto, estos 
pacientes experimentarían problemas secundarios relacionados con el 
aprendizaje nuevo, del tipo experimentado a menudo por los pacientes 
disejecutivos, que muestran típicamente un pobre control atencional y 
estratégico, tanto del aprendizaje como de la recuperación (Stuss y Knight, 
2002). 


2. Relación con la memoria semántica. El búfer utilizará frecuentemente 
información semántica para la representación de episodios, y estos episodios 
contribuirán a su debido tiempo con la memoria semántica, como parte del 
proceso normal de acumulación del conocimiento. 


3. Relación con las habilidades de procedimiento. Se supone que estas 


habilidades no juegan un papel importante en el búfer episódico, aunque, como 
se discutió anteriormente, es concebible que los planes de acción, como por 
ejemplo las instrucciones para realizar una tarea en particular, podrían ser 
almacenados temporalmente dentro del búfer. 


8.3.9. ¿Cuál es la relación entre la atención y la conciencia? 


Se supone que el búfer episódico está controlado por el ejecutivo central, un 
sistema con una capacidad atencional limitada. Se supone que la recuperación 
desde el búfer funciona principalmente a través del proceso de conciencia, 
permitiendo que la información procedente de múltiples fuentes se combine en 
una representación general coherente. 


8.3.10. ¿Cómo está implementado biológicamente el búfer? 


Parece poco probable que el búfer episódico refleje el funcionamiento de una 
única zona del cerebro. Ya que su función es reunir información de los distintos 
subsistemas, estará potencialmente influido por todos ellos en mayor o menor 
medida. Sin embargo, parece muy probable que los lóbulos frontales estén 
fuertemente implicados, dados sus extensos vínculos por todo el cerebro y su 
implicación en las funciones de «nivel superior» que coordinan procesos como 
la percepción y la memoria (Stuss y Knight, 2002). También es posible que el 
hipocampo contribuya combinando la información nueva dentro del búfer con 
información existente dentro de la MLP. 


Los procesos implicados en esta integración son esencialmente los mismos 
procesos que están implicados en cualquier teoría combinatoria. Las hipótesis 
actuales se reparten en dos amplias categorías. A nivel de células individuales, 
hay pruebas que sugieren que ciertas neuronas podrían estar especializadas en la 
detección de rasgos específicos, mientras que otras detectarían conjuntos de 
rasgos (Fuster, 2002). En principio, es posible que una jerarquía de estas 
neuronas pudiera proporcionar un mecanismo combinatorio, según las líneas 


perfiladas por Goldman-Rakic (1998). 


Un segundo enfoque sería sugerir que los componentes de una sola escena se 
integran a través de una activación sincronizada de las unidades relevantes (Gray 
y Singer, 1989; Hummel, 1999; Singer, 1999). Vogel et al. (2001) interpretan así 
su observación de que la capacidad de memoria de trabajo visual se encuentra 
limitada a unos cuatro objetos, independientemente de los rasgos que los 
compongan. Sugieren que el límite viene establecido por la interferencia que se 
origina debido al solapamiento de la actividad a medida que aumentan los 
objetos. 


La investigación en neuroimagen está empezando a tratar la cuestión de la 
integración de rasgos, gracias a un estudio de Prabakharan et al. (2000) 
particularmente relevante. Este estudio se preocupaba por el recuerdo de 
consonantes a corto plazo y el recuerdo del lugar en el que se sitúan. Se usaron 
cuatro condiciones. En una se mostraba a los sujetos cuatro consonantes y, tras 
una breve demora, se examinaba el reconocimiento presentándoles una 
consonante de prueba. Una segunda condición consistía en cuatro lugares 
espaciales, todos ellos igualmente probables. En la tercera condición se 
combinaba lo siguiente: se presentaban las consonantes en el centro de la 
pantalla y los lugares situados a lo largo de la pantalla. La última condición 
combinaba las dos tareas anteriores, se presentaban las consonantes en cada uno 
de los lugares relevantes. Se observaba el grado y la localización de la activación 
a través de una resonancia magnética funcional (fMRD), en la que las 
consonantes activaban áreas del hemisferio izquierdo típicamente asociadas con 
el bucle fonológico, mientras que las localizaciones activaban típicamente las 
áreas visuales equivalentes, concretamente el hemisferio derecho (ver Capítulo 
12). Si se presentaba simultáneamente la línea de consonantes y la serie de 
emplazamientos, se activaban los dos conjuntos de áreas. Sin embargo, cuando 
las consonantes se situaban en sus lugares correspondientes, el nivel general de 
activación se reducía, y su foco principal se desplazaba a la corteza frontal 
derecha, lo que les llevó a concluir que «los actuales resultados con £MRI 
proporcionan pruebas de otro búfer, concretamente uno que permite el recuerdo 
temporal de información integrada» (Prabakharan et al. , 2000, p. 89). 


Bor et al. (2003) llegaron a una conclusión similar en un estudio relacionado con 
la memoria de trabajo espacial. Ellos seleccionaron patrones matriciales que 
variaban en la facilidad con la que se podían agrupar en segmentos, y 
encontraron que a mayor grado de agrupamiento, mayor era la activación de la 


fMRI frontal. 


8.3.11. Relación con otros modelos 


Una de las ventajas del concepto de búfer episódico es que proporciona un 
puente entre el modelo de memoria de trabajo de Baddeley y Hitch, que acentúa 
la separación e identificación del subsistema fonológico y el visoespacial, y otros 
enfoques, que se centran más en los procesos ejecutivos, o bien en los vínculos 
con la MLP. Podría ser útil comparar el modelo revisado de memoria de trabajo 
multicomponente con algunos de estos enfoques. 


Mi propio enfoque tiene mucho en común con el de Cowan (2001; 2005), 
aunque a primera vista nuestros modelos puedan parecer muy diferentes. Él 
tiende a centrarse en las limitaciones atencionales, y es menos concreto acerca 
del subsistema visoespacial y el verbal. Esta me parece una cuestión relevante. 
De hecho, la mayor diferencia que yo encuentro entre nuestros enfoques es el 
énfasis que pone en la memoria de trabajo como una MLP activada, lo cual yo 
considero que podría infravalorar la capacidad de la MT para combinar y 
manipular la información de forma novedosa y creativa. 


El concepto de memoria de trabajo como una MLP activada aparece incluso más 
prominentemente en el modelo de memoria de trabajo a largo plazo de Ericsson 
y Kintsch (1995). El búfer episódico difiere de su enfoque en que asume un 
espacio de trabajo temporal y flexible que se basa en la memoria de trabajo; 
supone entonces un sistema mucho más dinámico que el de Ericsson y Kintsch, 
el cual parece depender de una simple activación de las representaciones en la 
MLP. 


El supuesto de un sistema activo y creativo se apoya en el hecho de que uno 
podría establecer fácilmente una combinación de conceptos totalmente nueva, 
como por ejemplo, un elefante hembra jugando al hockey sobre hielo, y, 
después, seguir resolviendo problemas como, ¿en qué posición jugará mejor? 
¿De defensa, quizá, gracias al placaje corporal? ¿O quizá mejor como portero? 
Esta manipulación de representaciones complejas recién creadas iría más allá de 
una simple activación, y se necesita algo parecido a un espacio de trabajo 
temporal. Cowan (2001) se aproxima un poco al proponer que las «señas» de los 


ítems que han sido activados en la memoria a largo plazo se mantienen en un 
almacén temporal. Este supuesto no parece ofrecer ninguna ventaja al concepto 
de búfer, ya que este seguiría requiriendo un almacenamiento y especificar cómo 
se podrían combinar estas señas. 


De forma más global, si asumimos una codificación multidimensional, el 
concepto de búfer episódico se hace algo más comparable a una serie de 
modelos de memoria a corto plazo y de memoria de trabajo, que asumen que el 
sistema se basa en una variedad de códigos memorísticos más amplia que la del 
modelo original. Aunque sigue habiendo diferencias entre mi propio modelo y 
los otros descritos, la mayor amplitud conseguida a partir del concepto de búfer 
episódico facilita la aparición de problemas comunes, concretamente el 
problema de cómo se relaciona la MT con la MLP. 


Por tanto, el concepto de búfer episódico parece ofrecer una posible 
interpretación sobre una gran serie de datos que han resultado ser problemáticos 
para un modelo de memoria de trabajo que asume un ejecutivo central 
puramente atencional. Se podría criticar que lo único que estoy haciendo es 
regresar al antiguo modelo del ejecutivo todopoderoso. Yo diría que la 
separación entre las capacidades atencionales y las de almacenamiento es un 
importante avance para el modelo. Que esté o no en lo cierto dependerá de lo 
exitoso que sea el búfer episódico a la hora de avanzar más allá de los datos 
existentes generando nuevos estudios que logren expandir nuestro conocimiento 
hacia nuevos y fructíferos horizontes. El próximo capítulo describe los primeros 
pasos encaminados a lograr este reto. 


CAPÍTULO 9 


Explorando el búfer episódico 


En el poco tiempo transcurrido desde que se propuso el concepto de búfer 
episódico, parece haber suscitado un gran interés y, al menos por el momento, 
parece haber motivado más aceptación que rechazo. Aunque es prometedor, se 
necesita algo más si queremos que el concepto sea más que una mera etiqueta 
aplicada a una serie de problemas sin resolver. En mi opinión, esto implica 
proporcionar un marco de trabajo que nos permita proponer cuestiones 
importantes, de forma que se produzcan nuevos descubrimientos empíricos. 
Acabamos de comenzar con este proceso, planteándonos como cuestión inicial el 
papel de los procesos ejecutivos en el proceso de combinación de la información 
desde dos o más fuentes en segmentos de información unificados. 


Nos hemos concentrado en dos paradigmas potencialmente contrastables, uno 
relacionado con la memoria de trabajo visoespacial y el otro con la memoria de 
prosa. En ambos casos, seguimos usando procedimientos con tareas secundarias 
que han demostrado ser productivos a lo largo de la evolución del modelo de 
memoria de trabajo. Aceptamos provisionalmente una distinción entre dos 
amplios tipos de combinaciones: una relativamente pasiva, que depende de 
procesos automáticos, y otra activa y atencionalmente demandante. Un ejemplo 
de combinación automática sería la influencia de los principios perceptivos de la 
gestalt, como la proximidad y la continuidad, al estructurar una escena visual, 
mientras que la combinación activa implicaría la combinación de un conjunto 
arbitrario de rasgos en un único segmento de información, como ocurriría al 
imaginarnos a una monja jugando a rugby con un sombrero rosa, por ejemplo. 
Tal como se comprobará, nuestras investigaciones siguen estando en una fase 
temprana, pero concluiré especulando sobre su impacto en mi actual punto de 
vista acerca del concepto de búfer episódico. 


9.1. Combinaciones en la memoria de trabajo visual 


Tal como mencionamos en el capítulo sobre la agenda visoespacial, un reciente 
progreso acogido con satisfacción es el creciente interés en la memoria de 
trabajo de algunos investigadores concentrados previamente en la atención 
visual. En una serie de estudios de Luck, Vogel, Woodman y colegas se concluyó 
que es posible mantener en la memoria de trabajo unos cuatro objetos, cada uno 
compuesto posiblemente por una amplia serie de rasgos (Luck y Vogel, 1997; 
Vogel et al. , 2001). Ellos proponen que la combinación de rasgos en objetos es 
un proceso automático que no requiere atención. 


Wheeler y Triesman (2002) extendieron y modificaron el enfoque de Luck y 
Vogel, y aunque coinciden ampliamente, ellos sugieren que la combinación de 
rasgos no es automática. Su conclusión se basa en un caso en el que se presentan 
una serie de figuras de diferentes colores, y luego se pone a prueba el recuerdo 
presentando una serie equivalente, en la que la forma y/o el color de un ítem 
puede haber cambiado o no. Aparece un rendimiento más pobre cuando se pide a 
los sujetos que recuerden la combinación de ambos rasgos, por ejemplo, el color 
y la forma, en vez de un único rasgo. Sin embargo, cuando en la fase de 
reconocimiento se empleó un solo ítem en lugar de una serie de ítems, para 
poner a prueba el recuerdo de las figuras presentadas, no hubo evidencias de que 
la combinación y el recuerdo de dos rasgos de un objeto fuera más demandante 
que recordar un solo rasgo como la forma. Argumentaron que la diferencia entre 
los dos estudios radica en que presentar varios rasgos simultáneamente en la fase 
de reconocimiento supone un demanda atencional mayor. Mientras que, en 
principio, esto podría reflejar la demanda atencional que supone la combinación 
en sí misma, la evidencia con un solo ítem sugiere que es más probable que sea 
resultado del esfuerzo atencional que supone buscar a través de la serie visual 
durante el mantenimiento o durante la recuperación, y no de la combinación 
durante la codificación. 


Decidimos investigar esta cuestión usando un paradigma de doble tarea. Si la 
combinación conjunta de dos rasgos es atencionalmente demandante, entonces 
esta combinación sería más fácilmente interrumpida por una tarea secundaria 
que la simple codificación de rasgos individuales (Allen et al. , en prensa). 
Nuestro primer experimento consistió en replicar los descubrimientos de 
Wheeler y Tiresman usando un solo ítem. Se les mostraba a los sujetos 
brevemente cuatro figuras, cuatro colores o cuatro figuras coloreadas. El 
recuerdo se medía presentándoles un solo ítem tras una breve demora y 


pidiéndoles que decidieran si el ítem se había presentado antes o no. Nuestros 
resultados en estas condiciones sugerían que los sujetos eran igual de buenos 
reconociendo colores y figuras combinados que reconociendo los rasgos por 
separado. Al igual que Wheeler y Tiresman, encontramos que cuando se 
empleaba un solo ítem en la prueba de reconocimiento, la combinación de rasgos 
en un solo objeto no supone un coste adicional. 


Posteriormente continuamos combinando nuestra tarea de memoria visual con 
una actividad concurrente atencionalmente demandante. Si la combinación de 
rasgos es atencionalmente demandante, entonces deberíamos esperar que fuera 
más sensible a los efectos de una carga adicional. Comenzamos pidiendo a 
nuestros sujetos que contaran de tres en tres hacia atrás, y encontramos que esto 
interrumpía el rendimiento general. Sin embargo, la interrupción no fue mayor 
para el caso de rasgos combinados de lo que fue para rasgos individuales, 
sugiriendo de nuevo que el proceso de combinación no suponía una demanda 
adicional de recursos atencionales generales. Se replicó el mismo resultado en un 
tercer estudio, en el que se comprobaron posibles complicaciones estratégicas, 
esta vez usando una tarea de amplitud de dígitos concurrente. Esta modificación 
correctora supone un pequeño coste adicional de la combinación sobre el 
recuerdo de rasgos individuales. En un experimento final, se presentaban los 
ítems secuencialmente y después se ponía a prueba el reconocimiento 
presentando un ítem de la secuencia. De nuevo, estudiamos el efecto de una 
tarea concurrente consistente en contar hacia atrás. Una vez más, cuando se 
presentó el ítem final, no encontramos evidencias claras de una mayor 
interrupción en el caso de rasgos combinados. Sin embargo, en los primeros 
ítems la interrupción era diferente, disminuía a medida que aumentaba el número 
de ítems interpuestos entre la presentación y el test. Esto sugiere que la 
combinación puede que sea automática, pero se ve interrumpida más fácilmente 
que la información procedente de rasgos individuales. 


Por el momento nuestros resultados apoyan la postura de Luck y Vogel acerca de 
una combinación relativamente automática de los rasgos, al menos cuando se 
presentan menos de cuatro objetos. Pensamos que quizá esta podía ser la línea 
base, y nos propusimos ampliar la investigación esperando que en algún punto la 
combinación de rasgos se volviera atencionalmente demandante. En un intento 
de incrementar la dificultad de la combinación, nuestra siguiente serie de 
estudios presentó figuras y colores en distintos lugares. La tarea demostró ser 
más difícil, pero de nuevo la carga concurrente no tuvo un efecto mayor sobre la 
codificación de rasgos por separado que sobre la codificación de rasgos 


presentados conjuntamente, como una figura coloreada (Karlson et al. , en 
preparación). 


Hasta el momento, nuestro trabajo se ha preocupado principalmente de la 
combinación de rasgos en objetos. Sin embargo, esperaríamos que los mismos 
procesos estuvieran funcionando a nivel de objetos combinados en unidades de 
información, en los que los principios gestálticos como la simetría, la 
continuidad y el cerramiento facilitaran la combinación. Evidencias de esto se 
obtuvieron en un estudio de Rossi-Arnau et al. (2006), en el que los sujetos 
tenían que recordar el lugar que ocupaban unos cuadrados coloreados dentro de 
una matriz. El experimentador mostraba una serie de lugares en una secuencia, 
una tarea similar a la del tamborileo de los bloques de Corsi, excepto que la serie 
de cuadrados a recordar formaba una matriz regular 5 por 5. Los lugares eran 
aleatorios o simétricos al eje vertical, horizontal o diagonal. Los sujetos eran 
capaces de beneficiarse cuando el patrón era simétrico con el eje vertical, pero 
no cuando eran simétricos con el eje horizontal o diagonal. El nivel de 
rendimiento se redujo con una tarea concurrente que suponía cierta demanda 
atencional, pero no interaccionó con la presencia de la simetría vertical, 
sugiriendo que el uso de esta propiedad gestáltica era automático. Un estudio 
posterior usó la presentación simultánea en vez de la secuencial, de forma 
similar a la tarea de amplitud de patrones más que a la tarea de Corsi. Se 
encontró un claro efecto de la simetría vertical, un efecto horizontal más débil y 
ningún efecto de la simetría diagonal. La carga atencional concurrente deterioró 
el rendimiento, pero de nuevo no interaccionó con la simetría. Concluimos que 
en el plano vertical el principio gestáltico de la simetría se codificaba 
automáticamente y de forma sencilla, un efecto que también aparecía para la 
percepción de la simetría, reflejando posiblemente la frecuencia y la importancia 
en el ambiente de los objetos verticalmente simétricos (Rossi-Arnaud et al. , 
2006; Pieroni et al., presentado). 


9.2. Combinación en la memoria de prosa 


Nuestra segunda línea de investigación empleó una condición mucho más 
compleja, gracias al recuerdo de prosa. Obviamente existe mucha investigación 
en esta área, aunque hay poca directamente ligada con la cuestión de la demanda 


atencional que supone la combinación. Toda evidencia está lejos de ser 
consistente. Poulton (1958), por ejemplo, pidió a sus sujetos que leyeran pasajes 
de texto a una velocidad que variaba de las 37 a las 293 palabras por minuto. 
Encontró que un incremento forzado en la velocidad de lectura deterioraba el 
reconocimiento posterior de frases acerca del significado del pasaje, en mayor 
medida que el reconocimiento de palabras individuales. Esto sugiere que la 
combinación de palabras individuales en unidades semánticas de mayor nivel se 
podría haber visto interrumpida por la demanda de una lectura más rápida. 


Nuestro propio estudio (Baddeley y Hitch, 1974) encontró que la comprensión y 
la retención de prosa se deterioraban cuando se pedía a los sujetos que repitieran 
concurrentemente una secuencia de seis dígitos aleatorios. En el mismo estudio, 
mostramos cómo una carga concurrente de dígitos deterioraba la velocidad de 
lectura, aunque normalmente no la exactitud, así como la velocidad en la 
verificación o el rechazo de frases que variaban en cuanto a la complejidad 
sintáctica, las cuales pretendían describir el orden de dos letras presentadas una a 
continuación de la otra (e.g., B no está precedida por A-AB). Cuanto mayor era 
la carga de dígitos, más lenta era la verificación (Baddeley y Hitch, 1974). El 
tamaño de la carga concurrente de dígitos también influyó en la velocidad con la 
que los sujetos podían verificar sintácticamente frases simples sobre el mundo, 
como «Los zapatos se venden por pares» o «Las monjas se venden por pares» 
(Baddeley et al. , 1984b). Como se discutió en el Capítulo 10, también existen 
abundantes pruebas que sugieren que las diferencias individuales en amplitud de 
memoria de trabajo, medida como la capacidad para almacenar y manipular 
información simultáneamente, correlaciona altamente con la comprensión 
lectora (Daneman y Carpenter, 1980; Daneman y Merikle, 1996). 


Sin embargo, la comprensión de prosa es una actividad compleja que implica 
considerablemente mucho más que una simple combinación de rasgos en la 
memoria de trabajo. En muchos estudios se ha empleado el recuerdo posterior 
acerca del significado de un pasaje de texto, que a su vez es probable que 
dependa de la memoria episódica. Existen considerables pruebas que sugieren 
que el input en la memoria episódica depende altamente de la atención 
disponible (Murdock, 1965; Baddeley et al. , 1984b). Por tanto, es posible que lo 
que se vea deteriorado por las distintas tareas secundarias no sea la combinación 
en sí misma, sino el recuerdo de estas combinaciones. 


Una segunda posibilidad es que la demanda atencional de la recuperación sea 
crucial. Esta es una interpretación menos probable por dos razones. Los estudios 


descritos hasta ahora imponen normalmente una carga atencional durante la 
codificación, pero no durante la recuperación (Murdock, 1965; Baddeley y 
Hitch, 1974). En segundo lugar, una gran cantidad de evidencias sugieren que el 
efecto de una tarea atencional concurrente sobre la recuperación es menos 
pronunciado que sobre el aprendizaje (Baddeley et al. , 1984b; Craik et al. , 
1996b; Naveh-Benajmin et al. , 2003). Finalmente, aunque a primera vista puede 
parecer que la abundante evidencia basada en la amplitud de memoria de trabajo 
constituye un claro ejemplo del papel de la atención sobre la combinación 
(Daneman y Carpenter, 1980; Just y Carpenter, 1992), estudios posteriores 
sugieren un cuadro algo más complejo. Una serie de estudios de Caplan y Waters 
(1999; Waters y Caplan, 2004) sugieren que la contribución de la sintaxis a la 
comprensión parece ser relativamente automática. Es más, aunque Baddeley y 
Wilson (2002) encontraron que la capacidad para recordar temporalmente un 
párrafo en prosa en una muestra pequeña de pacientes, muy inteligentes pero 
severamente amnésicos, estaba intacta, un estudio posterior remarcó que este uso 
de los procesos ejecutivos para mantener material en prosa puede ser 
relativamente inusual (Gooding et al. , 2005), y refleja probablemente una 
estrategia que depende de la mezcla entre una profunda amnesia y una alta 
inteligencia. 


En nuestro caso, las dudas sobre la importancia de la atención en la comprensión 
de prosa provinieron de una serie de intentos de desarrollar una tarea secundaria 
basada en la capacidad de los sujetos para generar secuencias aleatorias al pulsar 
teclas, una tarea que había demostrado ser una medida de la demanda atencional 
(Baddeley et al. , 1998b). Pedimos a nuestros sujetos que presionaran teclas al 
azar mientras que ejecutaban una serie de tareas concurrentes. A medida que 
aumentaban las tareas concurrentes, disminuía la aleatoriedad. El decremento era 
mayor en tareas en las que la demanda ejecutiva era alta, como la fluidez de 
categorías semánticas o ejecutar concurrentemente un test de inteligencia. 


En una serie de estudios posteriores que no se publicaron, decidimos aplicar esta 
técnica al análisis de la comprensión de prosa, pidiendo a nuestros sujetos que 
presionaran teclas tan al azar como les fuera posible, a una velocidad de una 
tecla por segundo, bien en solitario o bien leyendo uno de los tres textos en prosa 
con diferentes niveles de dificultad. Después se les pidió a los sujetos que 
respondieran a unas preguntas acerca del contenido del texto. El texto más 
sencillo se tomó de un cuento de hadas escrito para niños pequeños; el segundo 
pasaje, de dificultad intermedia, describía una enfermedad tropical, y el texto 
más difícil se tomó de un texto filosófico. Los tres diferían claramente en cuanto 


a las normas de legibilidad convencionales, y aunque eran equivalentes en 
longitud, el tiempo de lectura bajo condiciones no pautadas era diferente. 
Esperábamos que el nivel de dificultad se reflejara en el grado de azar mostrado 
al presionar las teclas, pero, para nuestra sorpresa, no encontramos ninguna 
evidencia de esto. Encontramos una reducción del grado de azar mientras se 
leían, pero la reducción no fue mayor en el texto filosófico que en el cuento de 
hadas. 


Supusimos que la ausencia del efecto de la complejidad del texto se debía a que 
los sujetos estaban compensando la dificultad del texto con la disminución de la 
velocidad de lectura. Para evitar esto, equiparamos la velocidad de presentación; 
en un estudio usamos una pauta visual y en el otro una presentación auditiva. 
Obtuvimos exactamente los mismos resultados, la lectura concurrente redujo el 
grado de azar, pero la reducción no fue mayor para el texto filosófico que para el 
cuento de hadas. Más aún, la presión aleatoria de teclas no influyó de manera 
diferente entre los distintos textos a la hora de responder a preguntas acerca del 
contenido de los mismos. 


Nuestros resultados, inesperadamente negativos, se basaban sin embargo en la 
relativa novedad de la técnica de presión aleatoria de botones, por lo que 
optamos por usar el método contrastado y fiable del tiempo de reacción 
concurrente (Posner y Mitchell, 1967). Pedimos a nuestros sujetos que leyeran 
varios textos al mismo tiempo que respondían tan rápido como fuera posible a 
un estímulo auditivo. Se usaron dos niveles de tareas concurrentes, el tiempo de 
reacción simple, que consistía en un solo tono, y el tiempo de reacción en la 
elección, en el que los sujetos tenían que responder de forma diferente según el 
tono fuera mayor o menor. Tal como esperábamos, el tiempo de reacción fue 
menor que el simple, y la lectura concurrente sufrió un enlentecimiento. No hubo 
efecto de interacción entre la legibilidad de los textos y el efecto de la demanda 
de la tarea concurrente: el texto filosófico y el cuento de hadas fueron 
igualmente interrumpidos y tuvieron el mismo efecto sobre el tiempo de 
reacción. 


En un último esfuerzo desesperado por demostrar un efecto de la dificultad de la 
tarea, incrementamos hasta ocho el número de alternativas en la tarea 
concurrente del TR. Los resultados se muestran en la Fig. 9.1. Ciertamente, 
nuestra tarea secundaria había incrementado su dificultad, tal como se reflejó en 
el rendimiento en el TR, pero, al igual que en los estudios anteriores, no 
encontramos evidencias de una mayor vulnerabilidad de los textos más 


demandantes, tanto si medíamos en términos del impacto de los textos sobre el 
tiempo de reacción como si medíamos el impacto de la tarea concurrente sobre 
el recuerdo posterior de los textos. 
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Fig. 9.1. La influencia de la complejidad de la prosa sobre la tarea concurrente 
del tiempo de reacción simple o del tiempo de reacción de elección. Los sujetos 
escuchaban un texto en prosa procedente de un cuento de hadas, un texto 
descriptivo o un texto filosófico, al mismo tiempo que realizaban una tarea de 
tiempo de reacción con dos alternativas o con ocho. (a) Indica que el tiempo de 
reacción no se vio influido por la dificultad del texto, y (b) que el nivel de 
recuerdo posterior no dependió de la dificultad de la tarea de TR. Datos de 
Baddeley y Anderson (sin publicar). 


Toda esta serie de experimentos parecían apuntar a un sistema en el que la 
diferencia entre textos era real, tal como indicaban las medidas de legibilidad 
estándar o la velocidad de lectura. También estaba claro, dado su efecto sobre la 
producción aleatoria, que la actividad de leer o escuchar era atencionalmente 
demandante. Sin embargo, la cantidad de atención dedicada a la comprensión 
parecía ser relativamente constante. Parecía un proceso de comprensión en el 
que el nivel de rendimiento quedaba establecido principalmente por otros 
factores como el conocimiento existente, en vez de la capacidad para sostener 
recursos atencionales. La comprensión parecía estar mucho más cerca de un 
proceso automático que de la continua generación de hipótesis o de la resolución 
de problemas. 


Sin embargo, nuestro enfoque tenía al menos una debilidad importante. 
Habíamos comenzado los estudios asumiendo que la tarea concurrente sería 
nuestra medida principal, tan solo usando un número relativamente pequeño de 
preguntas posteriores acerca del texto, para asegurarnos de que los sujetos 
pondrían atención en su contenido. Nuestros resultados no sugerían que el nivel 
de recuerdo posterior decayera con la suma de una tarea de demanda 
concurrente, pero esto podría simplemente reflejar la simplicidad de nuestra 
medida de recuerdo. Más aún, incluso si hubiéramos obtenido un efecto del 
significado de los textos sobre el recuerdo, esto podría haber reflejado la 
influencia de la atención sobre la memoria episódica, y no sobre la combinación 
en sí misma. Esta distinción está bien ilustrada en un estudio de Cermak y 
O*Connor (1983) de un paciente amnésico experto en tecnología láser. Era capaz 
de leer un artículo acerca de la evolución de la tecnología láser desde su 
enfermedad, y de explicársela al experimentador, pero posteriormente no 


recordaba el contenido del texto. Parecía ser capaz de combinar el material en 
una estructura comprensible, pero no de combinar esta estructura en la MLP. 


Decidimos, por tanto, minimizar la demanda de memoria episódica a largo 
plazo, usando para ello el recuerdo inmediato como medida de la combinación. 
Aunque esto no es precisamente ideal, ya que el rendimiento está probablemente 
influido por el bucle fonológico, estos efectos se pueden manipular mediante la 
supresión articulatoria. Elegimos estudiar el efecto de los hábitos de lenguaje 
sobre la combinación, variando sistemáticamente la estructura del material a 
recordar para poder detectar el impacto de los factores lingiiísticos y semánticos. 
Si la combinación de las palabras de una frase en unidades de información 
mayores supone una demanda atencional superior que el recuerdo memorístico 
de palabras sin relación alguna entre ellas, entonces deberíamos esperar que la 
combinación fuera más susceptible a la demanda de una tarea concurrente. 


La evidencia disponible sobre este tema resulta equívoca. Existe la ligera 
sospecha en nuestros resultados previos (Baddeley y Hitch, 1974; Hitch y 
Baddeley, 1976), de que las estructuras sintácticas más complejas, que 
ciertamente tardan más en verificarse, son más susceptibles a la demanda 
concurrente, aunque los resultados no sean muy convincentes, mientras que los 
estudios posteriores de Waters y Caplan (1996; 2004) sugieren que el 
procesamiento sintáctico es relativamente automático. Sin embargo, no 
estábamos especialmente preocupados por el papel de la sintaxis en la 
combinación, sino que preferíamos usar material basado en frases, ya que 
probablemente este se viera beneficiado por los hábitos de lenguaje a distintos 
niveles, incluyendo el nivel sintáctico, semántico y pragmático. Esperábamos 
que nuestra técnica de tareas secundarias nos informara si la combinación en el 
recuerdo de prosa depende y cuándo depende de la capacidad atencional. Se 
describirán dos conjuntos de experimentos, uno en el que se manipulan 
secuencias de oraciones simples, y otro en el que la manipulación es intra-frase. 


Jefferies et al. (2004a) pidieron a sus sujetos que escucharan y repitieran 
secuencias compuestas por una serie de oraciones simples declarativas. Por 
tanto, una secuencia de frases podría ser A los ratones les gusta comer queso; El 
tiempo en verano es caluroso; La calle era larga y polvorienta, mientras que, por 
otro lado, la condición de palabras aleatorias se compondría de las mismas 
palabras pero desordenadas, por ejemplo, gusta les a los ratones comer queso; 
verano en caluroso es tiempo el; larga polvorienta calle la era. El nivel de 
rendimiento se equiparó midiendo en primer lugar la amplitud, el número de 


frases y de secuencias de palabras sueltas que se podían recordar correctamente. 
Después examinamos a los sujetos usando secuencias que estuvieran un 50 por 
ciento por encima de su amplitud. Se les repetía tres veces seguidas, 
permitiéndonos estudiar tanto el recuerdo inmediato en un primer ensayo como 
el aprendizaje en los ensayos dos y tres. Finalmente, examinábamos a nuestros 
sujetos, bien bajo una condición de línea base en la que no se les interrumpía con 
una tarea concurrente, o bien se les pedía que presionaran continuamente uno de 
cuatro botones en respuesta a cada uno de los cuatro estímulos visuales que 
aparecían en distintas posiciones espaciales. En cuanto el sujeto respondía, 
aparecía el siguiente estímulo, un procedimiento que ha sido ampliamente 
utilizado por Craik y colegas, y que se ha demostrado que influye en la 
codificación de la MLP episódica y que él mismo se ve influido por la 
recuperación episódica (Craik et al. , 1996; Naveh Benjamín et al. , 2003). 


La tarea de TR concurrente deterioró el rendimiento, aunque el tamaño del 
efecto fue modesto y el patrón algo complejo. El recuerdo de la cadena de 
palabras inconexas mostró un escaso deterioro en el primer ensayo, pero en los 
ensayos de aprendizaje posteriores se encontró un deterioro mayor. En contraste, 
en el recuerdo de secuencias de frases, el máximo efecto se dio en el primer 
ensayo y luego fue decayendo. Tanto las palabras sueltas como las frases sueltas 
mostraron un aprendizaje, pero este fue más rápido en el caso de las frases. 


Este mismo resultado se replicó ampliamente en un segundo estudio en el que se 
incluyeron secuencias de oraciones más largas. El primer estudio empleaba listas 
que estaban un 50 por ciento por encima de la amplitud: en este estudio se 
aumentó hasta un 200 por ciento por encima de la amplitud. Si algo descubrimos 
es que las largas secuencias tendieron a mostrar un menor impacto de la tarea 
concurrente. De nuevo, la tasa de aprendizaje a lo largo de los ensayos fue 
mayor para el caso de las frases que para las listas de palabras. 


En un tercer estudio se incluyó un tercer tipo de material. Además de cadenas de 
palabras aleatorias y de secuencias de frases inconexas, usamos frases 
relacionadas temáticamente, haciendo que el material se aproximara más a la 
prosa normal. De nuevo las palabras sueltas mostraron un efecto de la demanda 
concurrente que se iba incrementando a lo largo de los sucesivos ensayos de 
aprendizaje, mientras que las frases sueltas mostraron el patrón opuesto. Sin 
embargo, las frases enlazadas temáticamente a modo de la prosa normal 
mostraron un efecto de la tarea concurrente muy pequeño, independientemente 
de la fase de aprendizaje. 


¿Cómo deberíamos interpretar este patrón de resultados? Tal como esperábamos, 
la mayor restricción proporcionada por el formato de oraciones y la 
compatibilidad semántica facilitó el recuerdo, siendo las frases sueltas más 
fáciles que las palabras sueltas, y siendo más fáciles a su vez los conjuntos de 
frases con un sentido coherente. El efecto de la tarea del TR concurrente fue 
menos predecible, sus efectos sobre el Ensayo 1 fueron algo distintos a los de los 
ensayos de aprendizaje posteriores. En el Ensayo 1, el recuerdo inmediato de 
oraciones se vio claramente deteriorado por la tarea concurrente, mientras que ni 
las palabras sueltas ni las oraciones con sentido coherente mostraron mucho 
deterioro inicial. 


Interpretamos estos resultados en términos de la demanda atencional impuesta 
por el agrupamiento en unidades de información. Las palabras sueltas son 
efectivamente equivalentes a una sola lista de palabras inconexas con un bajo 
nivel de restricciones secuenciales. Como Tulving (1962) mostró, en estas listas 
aleatorias se forman unidades de información subjetivamente organizadas, pero 
normalmente solo cuando la presentación se repite. El proceso de construcción 
gradual de los segmentos de información subjetivamente organizados supone 
presumiblemente una demanda de atención, tal como se refleja en el aumento del 
efecto de la tarea secundaria en los sucesivos ensayos. En el caso de las 
oraciones relacionadas temáticamente, parece que el agrupamiento de las 
palabras del interior de las frases en unidades de información es relativamente 
poco demandante, al igual que la combinación de frases en una sola unidad de 
información coherente para el caso del material temáticamente organizado. En el 
caso de las oraciones inconexas, no existe una unión temática entre ellas, por lo 
que es necesario crear algún tipo de combinación entre frases. Nuestros datos 
sugieren que esto sucede principalmente en el primer ensayo, y el impacto de la 
tarea concurrente decae en los ensayos posteriores, presumiblemente porque la 
fase atencionalmente demandante ya se ha completado ampliamente. 


Esto nos proporciona una explicación, aunque admitimos que, a posteriori, tanto 
del efecto del TR concurrente sobre el rendimiento en memoria como de los 
efectos comparables de la memoria sobre el TR, que también se han observado. 
Sin embargo, estos efectos son relativamente pequeños, en comparación con la 
influencia de la redundancia intra e interfrase sobre el recuerdo y sobre la tasa de 
aprendizaje, efectos que se basan presumiblemente en restricciones sintácticas y 
semánticas. Los efectos relativamente menores de la tarea de TR concurrente 
sobre estas variables sugieren que la influencia de los hábitos de lenguaje puede 
ser muy automática. Así, esta serie de experimentos nos proporcionan resultados 


que se asemejan a los de nuestros estudios en los que se variaba la dificultad del 
texto. Sin embargo, en este conjunto de experimentos, la tarea concurrente sí 
parece tener un impacto sobre el agrupamiento adicional requerido para 
combinar frases que no son temáticamente coherentes. Además, nos preocupaba 
otra cosa más. Al parecer, los sujetos encontraban que la tarea visual concurrente 
era relativamente poco demandante. Es más, incluso se les dejaba libertad para 
que pudieran usar el bucle fonológico y que su rendimiento en el recuerdo 
inmediato se viera aumentado. Estos temas se trataron en una segunda serie de 
experimentos que se centraron en el recuerdo inmediato de una sola oración 
(Baddeley et al. , en preparación). 


El problema de emplear material con oraciones es que puede variar ampliamente 
en cuanto al nivel de dificultad, según la estructura sintáctica de la frase y el 
conocimiento necesario para comprenderla. Este último punto se vio fuertemente 
remarcado en un estudio de Hambrick y Engle (2002) en el que pidieron a sus 
sujetos que recordaran extractos de comentarios sobre béisbol. Todos sus sujetos 
estadounidenses comprendían el béisbol, pero el grado de interés y conocimiento 
variaba sustancialmente de unos a otros. El número de sujetos mayores y jóvenes 
estaba compensado, la mitad con una alta capacidad de amplitud de memoria de 
trabajo y la otra mitad con una baja capacidad. Hambrick y Engle observaron un 
efecto importante del conocimiento del béisbol sobre el recuerdo posterior, junto 
con efectos mucho más pequeños de la edad y de la amplitud de MT, sugiriendo 
de nuevo la contribución relativamente automática del conocimiento sobre el 
recuerdo, junto con una contribución significativa, aunque pequeña, de los 
procesos atencionales. 


En un intento por limitar la influencia de estas diferencias individuales en el 
conocimiento previo, ideamos una tarea que denominamos amplitud de frases 
restringidas. Esta tarea consistía en usar un conjunto limitado de sustantivos, 
verbos, adjetivos y adverbios de forma repetida a lo largo de sucesivas frases, lo 
que daba lugar a secuencias todas ellas con significado, pero con un contenido 
semántico y sintáctico muy blando. Algunos ejemplos pueden ser, El viejo 
marinero le vendió la bicicleta roja a la abogada rubia, o El alto abogado le 
compró un coche rojo al marinero viejo, o La rubia marinera le compró una 
bicicleta verde al cura alto. Se podía incrementar la longitud de las frases 
añadiendo adjetivos y adverbios, todos ellos tomados de un conjunto restringido. 
Asumimos que estas frases serían sustancialmente más difíciles que frases 
«libres» tomadas de un discurso normal, ya que creíamos que la interferencia 
proactiva de las primeras frases obligaría al sujeto a confiar en las 


combinaciones activas más recientes. Tal como esperábamos, las frases 
restringidas eran algo más fáciles que las frases formadas con las mismas 
palabras pero en desorden, con una amplitud en torno a las seis y ocho palabras, 
respectivamente, pero fueron sustancialmente más difíciles que las frases 
«libres» seleccionadas de un periódico cuya amplitud media rondó las 12 
palabras pero con una gran variabilidad según qué frases concretas se usaran. En 
una serie de estudios piloto en los que se empleó este material, se observaron 
pocas diferencias en la amplitud de frases restringidas, según se usara 
repetidamente el mismo conjunto de palabras, o se usaran ítems completamente 
diferentes en cada ensayo, sugiriendo que la IP podría jugar un papel más 
pequeño de lo que anticipamos, posiblemente debido a una confianza mayor en 
el bucle fonológico. Optamos por usar el conjunto de frases restringidas basado 
en un banco de palabras limitado, para que operativamente fuera más fácil, ya 
que se generaron una gran serie de frases aproximadamente equivalentes en 
cuanto a la frecuencia de palabras, la dificultad y la capacidad para crear 
imágenes. 


Comenzamos a poner a prueba el recuerdo inmediato de palabras desordenadas, 
frases restringidas y frases libres, bajo condiciones control y junto con la tarea de 
TR visual de cuatro alternativas usada previamente por Craik et al. (1996) y por 
nosotros. Encontramos un pequeño impacto de la tarea secundaria sobre el 
rendimiento, lo que reforzó nuestra sospecha de que el bucle fonológico podría 
haber estado jugando un importante papel intermedio, y propició un estudio 
posterior, a fin de explorar sistemáticamente los papeles del bucle fonológico, la 
agenda visoespacial y el ejecutivo central en el recuerdo de frases y de palabras 
sueltas. 


Comenzamos ajustando la longitud de las frases restringidas y de las secuencias 
de palabras sueltas, de forma que el porcentaje de recuerdo fuera equivalente en 
ambos. Después desarrollamos una versión verbal y visual de la tarea de 
memoria N-back en la que los sujetos tenían que procesar una cadena de ítems, y 
responder cuando un ítem se repitiera tras una demora concreta. El nivel de 
dificultad se podía variar modificando esta demora, siendo más fácil de detectar 
una repetición inmediata con 0-back, y siendo posible aunque muy difícil con 2- 
back*, tanto con material verbal, dígitos, como con material visoespacial. Este 
último implicaba retener el lugar de una serie de puntos presentados en una de 
las celdas de una matriz 3 por 3. Los sujetos presionaban el botón 
correspondiente a la celda que se acababa de presentar (condición O-back) o bien 
el botón correspondiente a la celda presentada dos ítems antes. Pensábamos que 


ambas tareas 0-back implicarían al bucle fonológico y a la agenda, 
respectivamente, pero requerirían un procesamiento ejecutivo mínimo, mientras 
que las tareas 2-back supondrían una alta demanda de recursos ejecutivos, 
concretamente para los lóbulos frontales (ver Capítulo 12). 


Nuestro siguiente estudio implicaba la presentación auditiva de frases 
restringidas o de secuencias de palabras sueltas. Los resultados se muestran en la 
Fig. 9.2. Consideramos en primer lugar las tareas 0-back, las cuales se supone 
que sitúan la demanda en el subsistema fonológico y visoespacial. Hay un claro 
efecto de la tarea de dígitos O-back, lo que revela el papel del bucle fonológico, 
pero un pequeño efecto de la tarea visoespacial 0-back. Esto confirma nuestra 
sospecha de que la agenda visoespacial juega un pequeño papel sobre el 
recuerdo inmediato de material de este tipo. En contraste, ambas tareas 2-back 
dificultan el rendimiento, lo que revela el papel de los procesos ejecutivos sobre 
el recuerdo. Sin embargo, la ausencia de interacción entre la tarea concurrente y 
el tipo de material es crucial. Aunque los procesos ejecutivos facilitan el 
rendimiento, su efecto fue igual de efectivo para las palabras sueltas que para las 
frases, sugiriendo de nuevo que, bajo nuestras condiciones de recuerdo 
inmediato, gran parte del beneficio obtenido, si no todo, al usar material 
consistente en frases agrupables en segmentos de información, ocurre 
automáticamente. 
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Fig. 9.2. El recuerdo serial inmediato de frases presentadas auditivamente o 
secuencias de palabras sueltas en función de la tarea concurrente. Datos de 
Baddeley et al. , en preparación. 


Sin embargo, los estudios de frases restringidas descritos hasta el momento han 
usado la presentación auditiva. Incluso con la supresión articulatoria, esta 
presentación permite un acceso al bucle fonológico, aunque no al repaso 
subvocal. Nuestro próximo experimento trató de impedir todo uso del bucle, 
combinando la supresión con la presentación visual del material a recordar. 
Empleamos el mismo material, excepto que cada frase o lista de palabras sueltas 
se presentó visualmente. Esto excluía el uso de la tarea N-back visual, pero no de 
la verbal. Nuestros resultados se muestran en la Fig. 9.3. En esta ocasión, sí 
obtuvimos una interacción entre la tarea concurrente y el material, ya que las 
frases mostraron un mayor grado de interrupción que las palabras sueltas. Nos 
preocupaba que algún tipo de efecto suelo pudiera haber sido el responsable de 
este resultado, y por ello replicamos nuestro estudio usando una tarea menos 
demandante. El patrón de resultados fue el mismo. 
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Fig. 9.3. Recuerdo serial inmediato de frases visualmente presentadas y de listas 
de palabras sueltas en función de la tarea concurrente. Datos de Baddeley et al. , 
en preparación. 


En resumen, nuestro primer experimento demostró que cuando se dispone de un 
almacén extra, gracias al acceso al bucle, el agrupamiento en unidades de 
información, incluso cuando se impide el repaso verbal, parece ocurrir con 
escasa demanda aparente sobre los procesos ejecutivos. Cuando el acceso al 
bucle se bloquea completamente, combinando la supresión con la presentación 
visual, se necesitan los procesos ejecutivos para utilizar totalmente la 
redundancia secuencial que proporcionan las frases bien construidas con 
significado. 


9.3. Algunas implicaciones 


Al proponer que se debería añadir un componente adicional —el búfer episódico— 
al modelo de memoria de trabajo de tres componentes, yo esperaba dos cosas. 
En primer lugar, que se ampliaría el ámbito del modelo, cubriendo un amplio 
espectro de temas. En segundo lugar, que demostraría ser empíricamente 
fructífero al sugerir abordables, pero importantes cuestiones y proporcionaría 
nuevos descubrimientos. En este capítulo se han descrito los primeros pasos 
dirigidos hacia este último objetivo. ¿Han sido fructuosos? 


Escogimos tratar un tema central para el búfer, concretamente su capacidad para 
combinar información procedente de numerosas fuentes, dentro de la misma 
modalidad, así como entre distintas modalidades. En el caso de la memoria de 
trabajo visual, comenzamos investigando la combinación intra-modalidad, con la 
esperanza de que esta reflejara con más probabilidad un proceso automático en 
vez de uno ejecutivo. Nuestros resultados apoyaron ampliamente esta idea, 
proporcionando una línea base para explorar tareas de combinación más 
demandantes dentro de la misma modalidad, así como a lo largo de otras 
modalidades, entre distintos estímulos perceptivos, y en memoria semántica a 


largo plazo así como episódica. Nuestro trabajo se conecta con el de colegas 
como Luck, Vogel y Triesman que proceden del ámbito de la atención visual. 
Creemos que este vínculo entre ambos campos es importante, pero sospechamos 
que su trabajo es más probable que siga centrándose en la combinación de 
objetos visuales, mientras que el nuestro se moverá probablemente entre 
paradigmas más complejos cognitivamente. 


Nuestra segunda línea de estudio se preocupaba de analizar la contribución de 
los hábitos de lenguaje en la comprensión de prosa y en el recuerdo. De nuevo 
encontramos un efecto de los procesos ejecutivos más pequeño de lo esperado. 
En el paradigma de recuerdo inmediato, esto se debe en parte al papel que juega 
el bucle fonológico, el cual parece proporcionar un almacenamiento temporal 
suficiente como para que los sujetos pudieran hacer un completo uso de la 
redundancia dentro del material de prosa, sin necesidad de un apoyo ejecutivo 
adicional. Sin embargo, está claro que esta redundancia tiene un impacto 
sustancial sobre el rendimiento que no depende ni del bucle fonológico ni de una 
mayor contribución del ejecutivo. De nuevo esto sugiere el claro papel de los 
procesos lingiiísticos relativamente automáticos. Sin embargo, cuando el bucle 
fonológico se bloquea, usando la presentación visual y la supresión articulatoria, 
los procesos ejecutivos son necesarios para poder beneficiarse completamente 
del agrupamiento basado en el lenguaje. 


Nuestros resultados también suscitan interesantes cuestiones para los actuales 
modelos de recuerdo serial inmediato. Esto es particularmente evidente para el 
caso de algunos de los modelos computacionales de orden serial descritos en el 
Capítulo 2. Tal como vimos, los modelos de cadena en los que un ítem sirve de 
indicio para el siguiente, no daban buena cuenta de la evidencia (Baddeley, 
1968; Henson et al. , 1996). Esto dio lugar a una serie de modelos (Burgess y 
Hitch, 1999; Henson, 1998; Page y Norris, 1998) en los que el orden se 
almacenaba asociando cada ítem con un indicio sobre la posición serial, o bien 
con un contexto en evolución. Sin embargo, la esencia de la redundancia 
secuencial dentro de las frases reside en las asociaciones entre Ítems sucesivos, 
un fenómeno que se acomoda fácilmente a un mecanismo de cadena, pero que 
no se ajusta a los modelos posicionales o basados en el contexto. Es más, este es 
exactamente el tipo de dispositivo que se necesitaría si el bucle fonológico 
sirviera como mecanismo de adquisición del lenguaje que necesitara agrupar en 
palabras secuencias de fonemas nuevos, aunque fonotácticamente restringidos 
(Baddeley et al. , 1998a). 


Existen al menos dos maneras de afrontar este problema. La primera es asumir 
que el proceso de recuerdo serial que proponen estos modelos funciona en base a 
representaciones a nivel de los ítems, como de hecho asumen los modelos, ya 
que funcionan usando un conjunto limitado de ítems familiares, como los 
dígitos. Por tanto, suponiendo que se asuma que solo se seleccionarán los ítems 
léxicos existentes, los agrupamientos formados por secuencias fonológicas de 
distinto grado de complejidad se podrán hacer cada vez más disponibles a 
medida que avanza el aprendizaje. El proceso de aprendizaje de palabras nuevas 
se verá beneficiado si las palabras se parecen en su estructura al lenguaje natural 
de una persona, ya que es probable que ofrezcan más y mayores agrupamientos. 
Esto sigue sin responder a la cuestión de cómo se mantiene el orden serial dentro 
de estos segmentos de agrupación. Una posibilidad es que el mismo mecanismo 
opere como que en el nivel léxico —por ejemplo, un indicio de primacía—. Otra 
posibilidad es que en este nivel opere algún tipo de encadenamiento, aunque no 
opere en el nivel léxico estudiado previamente. 


Una interpretación muy diferente consiste en explicar el efecto de redundancia 
en términos de un proceso de recuperación bayesiano que se beneficia de las 
diferentes probabilidades fonotácticas. Un mecanismo así podría funcionar en 
distintos niveles posibles, incluyendo los primeros procesos de recuperación 
relativamente automáticos, y/o la posterior fase de comprobación menos 
automática. Estamos empezando a considerar estas opciones. 


A un nivel más estratégico, estos resultados nos han llevado a modificar nuestro 
supuesto inicial de una simple dicotomía entre la combinación activa y la 
automática, sugiriendo en cambio tres amplias categorías de combinación. 
Probablemente recordarás que uno de los estudios que más influyeron en el 
desarrollo del modelo del búfer episódico fue el hecho de que pacientes 
profundamente amnésicos fueran capaces de mostrar un excelente recuerdo 
inmediato de fragmentos en prosa, que claramente excedía a las capacidades del 
bucle y de la agenda. Al parecer, estos pacientes tenían una alta inteligencia y 
buenas habilidades ejecutivas, impulsándonos a concluir que el ejecutivo central 
jugaba un papel crucial en su recuerdo preservado de prosa (Baddeley y Wilson, 
2002). Sin embargo, nuestra investigación posterior sobre prosa sugiere que los 
procesos ejecutivos juegan un papel relativamente pequeño en el recuerdo de 
prosa para la mayoría de los sujetos. Al parecer, la diferencia crucial estaría en 
que poseen una MLP episódica normal. Por tanto, sugiero que aceptemos una 
tercera fuente de combinación importante, concretamente la que proporciona la 
memoria episódica a largo plazo. 


Un buen ejemplo de la capacidad de combinación de la memoria episódica 
proviene de dos estudios de Naveh-Benjamin y colegas. El primero de ellos 
estudió la memoria de reconocimiento en sujetos mayores y jóvenes, usando 
pares de palabras con una alta asociación semántica, o bien con una asociación 
semántica remota (Naveh-Benjamin et al. , 2003). Se midió el recuerdo mediante 
la capacidad para reconocer palabras individuales que acaban de ser presentadas, 
o bien, pares de palabras compuestos por dos palabras que podrían haber sido 
presentadas como una pareja o no. Los sujetos mayores lo hicieron tan bien 
como los jóvenes, tanto con las palabras individuales como con los pares de 
ítems asociados semánticamente, pero lo hicieron mucho peor con los pares 
remotamente asociados. Naveh- Benjamin et al. (2003) sugirieron que esto 
podría ser reflejo del efecto de la edad sobre la capacidad atencional. 


Esta hipótesis se puso a prueba en un estudio posterior (Naveh-Benjamin et al. , 
2004) en el que se repitió el mismo experimento excepto que en vez de emplear 
sujetos mayores y jóvenes, se usaron dos grupos de sujetos jóvenes, y a uno de 
los grupos se le pidió que ejecutara una tarea concurrente atencionalmente 
demandante. Se predijo que este grupo, dada la reducción de la atención 
disponible, se comportaría igual que el grupo de sujetos mayores. Esto no se 
cumplió. Hubo un impacto de la tarea concurrente sobre el rendimiento, pero que 
no interaccionó con la naturaleza de los pares de ítems a recordar. En suma, el 
déficit que muestra el grupo de sujetos mayores en su capacidad de combinación 
no era resultado de una pérdida atencional, sino de un déficit en la memoria 
episódica, el cual desafortunadamente es un rasgo común del envejecimiento. 


El tercer tipo de combinación se ha denominado combinación activa, y dentro 
del modelo de memoria de trabajo multicomponente, se supone que depende del 
ejecutivo central. Por el momento hemos encontrado escasa evidencia de este 
tipo de combinación en nuestros estudios sobre memoria visual, aunque es cierto 
que hemos comenzado a estudiar tareas en las que la combinación automática 
parecía más probable. En nuestros estudios sobre recuerdo de frases, hemos 
encontrado algunas evidencias de combinación activa basada atencionalmente, 
aunque menos de lo que anticipamos. 


9.3.1. Implicaciones para el modelo del búfer episódico 


Debo confesar que estoy algo sorprendido por nuestros resultados, ya que había 
pensado que la comprensión y la codificación de prosa sería un proceso mucho 
más activo y demandante de lo que parece ser. Parecer que el «esfuerzo por 
buscar el significado» término acuñado por Bartlett (1932), puede que no sea un 
esfuerzo tan grande después de todo. Nuestros resultados conllevan 
implicaciones teóricas para el modelo inicial del búfer episódico. Debe 
recordarse que el modelo omite explícitamente cualquier conexión directa entre 
el búfer episódico y el subsistema fonológico y el visoespacial, dirigiendo la 
información a través del ejecutivo central. ¿Cómo explicaría este modelo 
nuestros resultados? 


Primero vamos a considerar los estudios sobre combinación en la memoria de 
trabajo visoespacial. El hecho de que la tarea concurrente atencional no 
interrumpa la combinación de forma diferencial sugiere que la combinación de 
rasgos no precisa de recursos ejecutivos. Sin embargo, siempre que se acepte que 
la combinación pasiva se puede dar a un nivel más periférico, este resultado no 
es problemático, aunque ciertamente sí sería consistente con una unión directa 
entre la agenda visoespacial y el búfer episódico. El resultado del material con 
frases es más desafiante, ya que la combinación parece implicar tanto al bucle 
fonológico como a la información procedente de la memoria semántica, en el 
caso de frases restringidas, mientras que la memoria para palabras sueltas parece 
depender principalmente de una codificación fonológica (Baddeley, 1966a; b). 
Cuando la presentación era auditiva, la interrupción del ejecutivo central tenía un 
efecto equivalente sobre ambos tipos de material, lo que parecía sugerir que el 
uso del conocimiento semántico y sintáctico no depende del funcionamiento del 
ejecutivo. Si esto es así, entonces supone una prueba preliminar de la unión 
directa entre el bucle fonológico y el búfer episódico. Desde mi punto de vista, 
en este momento las evidencias se inclinan hacia un vínculo directo entre los 
subsistemas visoespacial y fonológico y el búfer episódico multidimensional. 


¿En qué lugar deja esto a la hipótesis del búfer episódico? En primer lugar, la 
hipótesis ha demostrado ser útil generando cuestiones, y aclarándolas con 
respuestas. Como en el caso de las preguntas que suscitaron los experimentos 
iniciales de Baddeley y Hitch en 1974, las respuestas no son justo lo que 
esperábamos, pero, sin embargo, sí proporcionan un claro espacio de trabajo que 
nos permite un mayor desarrollo del modelo. Como veremos más adelante, la 
memoria de trabajo está empezando a surgir simplemente como uno de los 
sistemas importantes que componen la cognición compleja, muchos de los 
cuales funcionan de manera relativamente automática. Si queremos comprender 


la memoria de trabajo, entonces tendremos que entender no solo lo que hace el 
sistema, sino también lo que necesita hacer. 


Notas al pie 


* Cuando el mismo ítem se ha presentado dos posiciones atrás en la secuencia. 
N, de la T. 


CAPÍTULO 10 


Diferencias individuales y amplitud de memoria de trabajo 


La posibilidad de que las personas difieran en sus capacidades cognitivas, y de 
que estas diferencias sean estudiadas científicamente, se remonta al menos hasta 
Sir Francis Galton, que inventó la técnica de la correlación, precisamente para 
estudiar estas diferencias (Galton, 1883). John McKeen Cattell, un joven 
americano visitante del laboratorio de Wundt en Leipzig, decidió estudiar 
diferencias entre individuos en cuanto a sus capacidades básicas, tales como la 
sensibilidad sensorial y la velocidad de reacción, y encontró correlaciones 
positivas aunque más bien bajas en el rendimiento de un individuo en esta serie 
de medidas (Boring, 1929). 


10.1. La tradición psicométrica 


10.1.1. Desarrollos tempranos 


Sin embargo, este moderno enfoque de las diferencias individuales surge a partir 
de un problema práctico. El psicólogo francés Alfred Binet, en colaboración con 
André Simon, el director de un colegio para niños discapacitados, desarrolló 
métodos que permitían identificar a niños con necesidades educativas especiales. 
La idea era que estos niños recibieran una educación especial. Sin embargo, 
dado que en aquellos momentos la evaluación dependía de los juicios de los 
profesores, existía el miedo de que este pudiera ser un método poco efectivo, y, 
en consecuencia, los niños que necesitaran una ayuda extra no la recibieran, 
mientras que otros serían inapropiadamente situados en un ambiente educativo 
poco desafiante. 


Binet empleó un enfoque muy pragmático. Desarrolló una serie de pequeñas 
tareas fácilmente mensurables, las cuales, mediante la observación y mediante 
ensayo y error, parecían distinguir consistentemente entre niños con evidentes 
problemas intelectuales y niños que claramente no los tenían. Es más, el nivel de 
rendimiento en estas pruebas mejoró continuamente a medida que los niños se 
hacían mayores, alcanzando una estabilidad alrededor de los 16 años. 
Expresando la puntuación de un niño de forma proporcional a la puntuación 
media de los niños en esa edad cronológica, se consiguió una medida simple 
pero potente, el Cociente Intelectual, o CL. 


Un visitante estadounidense, H. H. Goddard, se percató del potencial de este 
enfoque, y siguió desarrollándolo y promocionándolo a su llegada a los EE.UU. 
A lo largo del siguiente siglo, este enfoque se convirtió en una industria 
importante, la psicometría, ampliamente utilizada tanto en la educación como en 
las decisiones laborales, respaldada por un arsenal de técnicas estadísticas cada 
vez más sofisticadas. Sin embargo, el enfoque también suscitó algunas 
controversias que fueron contestadas ardientemente, relacionadas con la 
naturaleza de la inteligencia, el constructo subyacente que se supone que miden 
muchos de los tests. Entre estas controversias se incluyen, el tema de si la 
inteligencia depende de la herencia o del ambiente, la cuestión de si existen 
diferencias raciales y, de forma más general, el papel de los factores culturales en 
el rendimiento en estos tests (para una excelente revisión, ver Mackintosh 
[1998]). 


A pesar de la controversia, parece haber claras evidencias de los sustanciales 
logros conseguidos en la medición de la inteligencia, gracias al enfoque 
psicométrico. La Asociación Americana de Psicología creó un comité dirigido 
por un psicólogo cognitivo, Ulric Neisser, encargado de evaluar lo que sabemos 
y lo que no sabemos acerca de la inteligencia. El comité concluyó que, aunque 
todavía queda mucho por investigar, los tests de inteligencia desempeñan una 
función útil a la hora de predecir con razonable precisión quién trabajará con 
más eficacia en la sociedad occidental actual. Por supuesto, esto no significa que 
estas características tengan que ser necesariamente óptimas en otras sociedades, 
ni en toda la serie de posibles trabajos de nuestra sociedad. Es más, está claro 
que estos tests no miden otras muchas importantes cualidades personales y 
emocionales, ni es probable que predigan el rendimiento en una serie de 
actividades como la música o la pintura. No obstante, la industria psicométrica 
ha tenido un éxito práctico considerable en la predicción de los logros 
académicos y laborales (Neisser et al. , 1996). 


10.2. El concepto de inteligencia 


El enfoque psicométrico ha tenido un éxito considerablemente menor a la hora 
de generar conocimiento teórico acerca de los procesos que subyacen a un alto o 
bajo rendimiento en los tests de inteligencia. Durante los primeros años del 
último siglo, Spearman (1927) se dio cuenta de que los tests que componían una 
batería, como por ejemplo la batería propuesta por Binet, tendían a correlacionar 
positivamente unos con otros. Lo interpretó sugiriendo que todos formaban un 
único componente que denominó inteligencia general, o G. Desarrolló un 
método estadístico conocido como análisis de factor exploratorio para investigar 
esta relación, respaldando su argumento al identificar tanto G como una serie de 
factores subsidiarios más específicos. Este enfoque fue contestado por el 
psicólogo americano Louis Thurstone (1940) quien apuntó con cierta razón, que 
cualquier selección de tests podría tener un grupo similar entre sí, y que por 
tanto producirían un factor central. Por ejemplo, el investigador A puede que 
tenga muchas tareas basadas en el razonamiento verbal, mientras que el 
investigador B puede que tienda a elegir muchas tareas visoespaciales. Cada uno 
obtendría un factor G, pero no serían iguales. 


Una forma evidente de intentar tratar estos problemas es observar una amplia 
serie de estudios diferentes para decidir si el patrón observado se parece más al 
factor G de Spearman o a los múltiples factores independientes de Thurstone. 
Este análisis fue realizado por John Carroll (1993), quien analizó no menos de 
400 de estos estudios, llegando a los resultados representados en la Fig. 10.1, 
tomados de una breve pero excelente investigación de lan Deary (2001) sobre la 
inteligencia. Como sugiere la Fig. 10.1, parece existir un apoyo al factor general, 
junto con una serie de procesos subsidiarios más bien mezclados, que a su vez 
pueden ser analizados en componentes aún menores. En un estudio sobre 
habilidades motoras de Edwin Fleishman (1965) y Fleishman y Parker (1962), 
por ejemplo, se identificaron no menos de 14 subfactores sobre la conducta 
motora, entre los que se incluyen el control de la precisión, el tiempo de reacción 
de la respuesta de orientación, la velocidad de movimiento del brazo y la 
velocidad muñeca-dedo, junto con otras nueve habilidades que se relacionan con 
aspectos físicos o estructurales del cuerpo, como la flexibilidad estática y 
dinámica y la fortaleza, la coordinación del cuerpo y la fuerza del torso. 


Para un psicólogo cognitivo como yo, los subcomponentes parecen representar 
una lista muy larga y algo incoherente que no ayuda mucho a nuestro 
conocimiento básico. Sospecho que un problema básico es la confianza en la 
correlación como la principal herramienta analítica. Dos tests pueden 
correlacionar o no correlacionar entre sí debido a razones diferentes. Por 
ejemplo, es probable que la selección que hizo Binet de la amplia serie de tareas 
complejas fuera más efectiva que el intento previo de Cattell, porque este último 
se centró simplemente en medidas unitarias. Binet, sin embargo, usó tareas 
complejas que presumiblemente se relacionaban con muchos procesos 
subyacentes diferentes, proporcionando posiblemente una medida que reflejaba 
muchas capacidades diferentes. Desde el punto de vista práctico de la selección 
de niños con probabilidad de tener dificultades en colegios normales, esto no es 
un problema, pero si uno quiere saber exactamente qué subyace a las diferencias 
entre niños, entonces el enfoque del test complejo múltiple posee claras 
limitaciones. 


Inteligencia 
fluida 


Inteligencia 
cristalizada 


Percepción Percepción 


visual extensa auditiva extensa 


Amplia capacidad 
de recuperación 


Inteligencia 
general 


g 


Amplia velocidad 
cognitiva 


Memoria general Velocidad 


y aprendizaje de procesamiento 


Fig. 10.1. Una representación jerárquica de las asociaciones entre las 
puntuaciones de los tests de habilidades mentales. Este diagrama fue el resultado 
de décadas de trabajo de John B. Carroll, quien reanalizó cerca de 400 bases de 
datos clásicas sobre investigación en inteligencia humana. Reproducido a partir 
de I. J. Deary Intelligence: A Very Short Introduction, Oxford University Press, 
con su permiso. 


Por supuesto, los investigadores han intentado crear tests sobre funciones 
concretas, pero en ausencia de una base teórica independiente, los nuevos tests 
simplemente reflejarán las intuiciones del diseñador, junto con el rechazo de 
aquellos tests que no tiendan a correlacionar con los factores propuestos. Puede 
que esta sea una crítica injusta, ya que cualquier enfoque teórico necesita salir 
adelante empleando sus supuestos iniciales. Sin embargo, por alguna razón, el 
enfoque psicométrico parece haber tenido menos éxito con el desarrollo de una 
teoría que con sus objetivos prácticos. Mackintosh resume la situación de la 
siguiente manera: 


El análisis factorial no puede hacer más que describir las relaciones entre 
distintos tests de CI. Esto no es lo mismo que descifrar la estructura de las 
capacidades humanas. Esto solo se conseguirá mediante el desarrollo y el 
examen de la teoría psicológica. Por tanto, el hecho de que siempre se pueda 
extraer un factor general de una batería de tests de Cl no significa que solo haya 
un proceso cognitivo subyacente en el que todos los tests de CI tengan un peso. 
Es igualmente posible que todos los tests de CI tengan pesos en una gran serie de 
procesos diferentes, pero hay cierto solapamiento en el conjunto de procesos 
cubiertos por los diferentes grupos de tests. La decisión entre estas posibilidades 
alternativas requerirá un análisis experimental y teórico. 


(Mackintosh, 1998, p. 230) 


Un ejemplo interesante de los problemas derivados de la aplicación del enfoque 
psicométrico al análisis de la cognición se observa en los estudios recientes 


sobre envejecimiento cognitivo. 


10.2.1. El enfoque psicométrico en el envejecimiento y la cognición 


En los últimos años se ha producido un crecimiento sustancial en el número de 
psicólogos cognitivos que trabajan en el campo del envejecimiento. Dado el 
envejecimiento de la población occidental, es muy apropiado, por supuesto, que 
los gobiernos se preocupen por la eficacia con la que la gente se comportará en 
una sociedad tecnológica que cambia rápidamente y que por tanto supone una 
constante demanda intelectual para jóvenes y viejos. Naturalmente, esto nos 
lleva a la cuestión de, ¿cuáles son los cambios cognitivos que se producen a 
medida que nos hacemos mayores? Es obvio que cambian muchas cosas, y una 
solución es intentar reducir la gran cantidad de medidas cognitivas que cambian 
con la edad hasta quedarnos con algo más manejable, quizá incluso con un solo 
factor crucial, el factor G del envejecimiento, ¿quizá el factor E? 


Podemos aproximarnos a este problema tomando una muestra de sujetos de 
distintas edades, poniéndoles a prueba en una amplia serie de tareas, y después 
generando clusters de tareas mediante el análisis factorial o alguna otra técnica 
relacionada. El siguiente paso es ver cómo correlacionan cada una de ellas con la 
edad, y hasta qué punto se correlacionan unas con otras. Supongamos que ambas 
correlacionan con la edad, el factor X mucho y el factor Y menos. Es concebible 
que la relación con la edad provenga en ambos casos de un componente común 
compartido por X y por Y. Si esto es así, entonces, al permitir esta correlación, 
habrá poca varianza adicional que se deba a Y, el cual se puede descartar como 
principal determinante del declive cognitivo relacionado con la edad. 
Consideremos un tercer factor, Z. Este factor podría estar menos correlacionado 
con la edad que Y, pero si es relativamente independiente de X, entonces 
permitir la correlación con X no cambiaría sustancialmente la correlación, lo que 
nos lleva a concluir que el factor Z refleja de hecho un componente cognitivo del 
envejecimiento que difiere del aportado por X. 


En los últimos años un gran número de estudios sobre envejecimiento cognitivo 
han utilizado este enfoque y otros relacionados. El ejemplo más amplio y más 
cuidadosamente argumentado proviene del trabajo de Tim Salthouse (1992; 


1996), quien, tras revisar muchos estudios, concluyó que la mayor parte de la 
varianza, si no toda, de la función ejecutiva como consecuencia de la edad se 
puede obtener a partir de un solo factor, la velocidad de procesamiento. Por 
tanto, mientras que una amplia serie de medidas decaen con la edad, aquellas 
basadas en la velocidad de procesamiento parecen ser las mejores predictoras del 
declive general, quedando poca o ninguna varianza explicada por otros factores, 
como el rendimiento en memoria o el control atencional. Claramente, la 
memoria decae con la edad, y normalmente no se mide con tareas de velocidad. 
Sin embargo, se puede decir que depende de la velocidad de funcionamiento de 
los procesos subyacentes, como la codificación y la recuperación, por lo que un 
lento procesamiento da lugar a una codificación menos completa y menos 
elaborada, y por tanto a una recuperación más lenta y menos efectiva (Salthouse, 
1996). Aunque la velocidad de procesamiento fue desarrollada por Salthouse 
para explicar el declive de la función cognitiva en la tercera edad, se ha aplicado 
de forma mucho más amplia para explicar, por ejemplo, el desarrollo de las 
capacidades cognitivas en los niños (Fry y Hale, 1996; 2000; Kail, 1988; 1992; 
Kail y Park, 1994). 


Sin embargo, hay problemas para concebir la velocidad como una función 
psicológica unitaria. En general, todas nuestras medidas psicológicas se basan en 
la medición de la velocidad, o bien de la precisión. Por supuesto, sería 
interesante si tan solo la velocidad fuera sensible a los efectos de la edad. Pero 
este no parece ser el caso. 


Al mismo tiempo que Salthouse dirigía su programa en Atlanta, un psicólogo 
alemán, Paul Baltes, dirigía un amplio estudio paralelo en Berlín. A lo largo de 
una serie de años, estuvo examinando repetidamente a sujetos de un amplio 
rango de edades en muchas tareas diferentes, llegando a conducir un análisis 
estadístico parecido al de Salthouse. Lo que Baltes y su grupo encontraron fue 
que los dos mejores predictores de la diferencia de edad eran dos medidas 
sensoriales —la sensibilidad auditiva y la visual-, medidas en términos de 
precisión, no de velocidad (Baltes y Lindenberger, 1997). Aunque es posible 
argumentar que toda cognición refleje la velocidad de las operaciones básicas, es 
más difícil argumentar que una visión pobre cause un rendimiento pobre en una 
tarea de memoria auditiva, o que las deficiencias auditivas den lugar a un tiempo 
de reacción visual lento, ni que esté relacionado causalmente con el declive 
observado en memoria o con la capacidad de razonamiento. Otro problema para 
la sencilla hipótesis de la velocidad provino de la observación de que un 
predictor igualmente bueno del declive cognitivo que se produce con la edad era 


el que proporciona la fuerza de prensión, dando un nuevo sentido a la expresión 
«Está perdiendo los estribos» (Baltes y Lindenberger, 1997). El vínculo causal 
directo entre la sensibilidad perceptiva y la cognición general no era, por 
supuesto, el que había propuesto el grupo de Baltes. Como apuntan Lindenberger 
y Pótter (1998), en las explicaciones teóricas del envejecimiento cognitivo ha 
existido la tendencia a ignorar el hecho básico de que la correlación no 
demuestra causalidad. 


Es probable que muchas funciones diferentes decaigan de forma paralela a 
medida que nos hacemos mayores. Según la potencia concreta de la batería de 
tests empleada, un test u otro resultará más sensible y/o más fiable como medida 
de este proceso multicomponente subyacente, y por tanto, estadísticamente, será 
capaz de eclipsar a los indicadores de los otros muchos procesos en declive 
paralelamente, los cuales precisamente son peor detectados por los métodos 
empleados. Este no es un problema si lo que se pretende predecir es el 
rendimiento probable de un anciano o arrojar conclusiones generales sobre el 
rendimiento general más probable de una población, propósitos por los que 
inicialmente se desarrollaron los métodos psicométricos. Sin embargo, sí es un 
problema si uno desea proporcionar una explicación causal de la naturaleza del 
cambio. Las medidas de velocidad pueden ofrecer una potente predicción acerca 
del declive en el rendimiento, pero se necesita saber si su éxito es consecuencia 
del promedio de los muchos procesos que están en declive o solo de un único 
proceso crucial. En este último caso, es importante entonces especificar su 
naturaleza e investigarla directamente. 


La idea del envejecimiento como reflejo del declive de múltiples sistemas en 
paralelo se ha denominado a veces como la hipótesis del coche Ford (o, en Reino 
Unido, como la teoría del bombín de bicicleta de Woolworth). Estos dos 
inventos han sido diseñados usando componentes construidos con un nivel de 
duración mínimo, evitando así el gasto innecesario que supone que una pieza 
dure más de lo debido. Quizá esto podría considerarse como la hipótesis nula del 
envejecimiento cognitivo, una sencilla teoría que necesita descartarse antes de 
aceptar la hipótesis alternativa que probablemente sea más interesante. De 
hecho, es posible que se demuestre que la hipótesis del declive múltiple en 
paralelo es inadecuada; sin embargo, demostrar esto requerirá evidencias más 
fuertes que las proporcionadas hasta el momento por el enfoque correlacional del 
envejecimiento cognitivo. 


10.3. Diferencias individuales en memoria de trabajo 


10.3.1. Amplitud de memoria de trabajo 


Una aproximación al estudio de la memoria de trabajo apoyada por Baddeley y 
Hitch (1974) se basó en los clásicos métodos de la psicología cognitiva 
experimental, junto con pruebas de casos neuropsicológicos. En Norteamérica, 
sin embargo, la mayor parte de la investigación en esta área se ha basado en 
métodos psicométricos usando diferencias individuales entre grupos de sujetos 
normales, que se investigaban mediante métodos correlacionales. Esta línea de 
investigación se inició gracias a un estudio altamente influyente, no tanto por el 
análisis de la memoria de trabajo per se, sino por su papel potencial en la 
comprensión del lenguaje. Daneman y Carpenter (1980), aceptando la propuesta 
de Baddeley y Hitch (1974) de que la memoria de trabajo implicaba una 
combinación de almacenamiento y procesamiento de información, combinaron 
estos procesos en una tarea que se conoce como amplitud de memoria de trabajo. 
Pidieron a sus sujetos que leyeran una serie de frases en alto, y que 
posteriormente recordaran la última palabra de cada frase, definiendo la 
amplitud como el máximo número de frases que se podrían procesar y recordar 
correctamente de esta manera. Por ejemplo, se podía pedir a un sujeto que 
leyera: 


Durante unas horas la batalla por la casa rugió. 


El no permitiría bajo ninguna circunstancia que el joven señor le comprara su 
ticket, 


Donde la respuesta correcta sería «rugió» y «ticket». El rendimiento difiere 
consistentemente de unos sujetos a otros, siendo capaces de recordar típicamente 
entre dos y cinco palabras del final. 


Daneman y Carpenter (1980) encontraron que esta simple medida correlacionaba 


muy significativamente con las puntaciones en comprensión lectora de sus 
sujetos, estudiantes en la Universidad de Carnegie-Mellon, tanto si se medía a 
través de las puntuaciones verbales en el Test de Aptitud Escolástica, como a 
través de la comprensión de prosa medida con el Test de Lectura Nelson- Denny. 
Siguieron demostrando que los estudiantes con altas amplitudes eran 
consistentemente mejores a la hora de recordar información relevante de una 
frase a otra, dentro de un texto en prosa, tal como lo indica la referencia 
pronominal (Daneman y Carpenter, 1983). Los sujetos con altas amplitudes 
también muestran un uso más eficiente de la información contextual para 
interpretar palabras no familiares dentro de un texto complejo (Daneman y 
Carpenter, 1983). McDonald et al. (1992) y King y Just (1991) mostraron que 
los sujetos con altas amplitudes eran mejores analizando y comprendiendo textos 
potencialmente ambiguos, y eran capaces de mantener los múltiples significados 
potenciales de una palabra concreta, como «banco» (de peces o financiero), 
durante períodos más largos. Estos autores tendían a considerar que su medida 
era más consistente con el modelo de memoria de trabajo, y reflejaba un sistema 
más complejo que el bucle fonológico, pero algo más específico 
lingúísticamente que el ejecutivo central (Daneman y Tardif, 1987). Volveremos 
a este tema más tarde. 


10.3.2. ¿Es la memoria de trabajo específica del lenguaje? 


En los años posteriores, muchos estudios han replicado la fuerte asociación entre 
amplitud de memoria de trabajo y comprensión de lenguaje. Daneman y Merikle 
(1996) identificaron unos 74 estudios en los que se obtuvieron resultados 
similares, con una correlación media entre amplitud de memoria de trabajo y 
comprensión de 0.41 para la comprensión global (N = 38), y 0.52 para medidas 
de comprensión más específicas (N = 36). Para las tareas de MCP que implican 
almacenamiento pero no procesamiento, las correlaciones fueron menores, 0.28 
para medidas de comprensión globales, y 0.40 para las específicas. 


Sin embargo, el poder predictivo de la amplitud de memoria de trabajo no está ni 
mucho menos limitado a la comprensión del lenguaje. Engle et al. (1991), 
mostraron que los niños con grandes amplitudes tenían una capacidad mayor 
para seguir y obedecer complejas secuencias de direcciones, siendo la influencia 


de la amplitud mayor para las secuencias grandes y para los niños más mayores. 
Benton et al. (1984) valoraron la capacidad de sus sujetos para componer textos 
en prosa, y encontraron que los sujetos con mayores amplitudes hacían mejores 
composiciones. En la misma línea, Kiewra y Benton (1988) encontraron que la 
amplitud de memoria de trabajo era mejor predictor que el ACT ( American 
College Test), en la nota media final, y en la capacidad de los estudiantes para 
tomar apuntes y sacar partido de ellos en un test posterior. 


Se podría argumentar que todas las tareas descritas hasta el momento son 
esencialmente medidas de comprensión y uso del lenguaje, y que predecir la 
comprensión del lenguaje a partir de un test de procesamiento de frases 
difícilmente supone un resultado sorprendente. Hay una serie de razones para no 
estar de acuerdo con esta crítica. En primer lugar, dada la brevedad y aparente 
simplicidad de la medida de amplitud, es de destacar que pueda predecir toda esa 
serie de tareas sobre procesamiento de lenguaje, y que lo haga con esa aparente 
replicabilidad. Más relevante, como veremos, es que aunque Daneman y 
Carpenter estaban preocupados principalmente por el procesamiento del 
lenguaje, la amplitud de memoria de trabajo ha demostrado que predice una serie 
de tareas mucho más amplia. Kyllonen y Stephens (1990), por ejemplo, estaban 
interesados en la capacidad de la amplitud de memoria de trabajo para predecir 
el rendimiento de los candidatos a las Fuerzas Aéreas de Estados Unidos en las 
complejas tareas que se les requerían. Encontraron una alta correlación entre la 
amplitud y el rendimiento de los estudiantes en un curso sobre puertos lógicos. 
Shute (1991) realizó un estudio similar en el que los sujetos participaban en un 
curso de 40 horas de duración sobre el lenguaje de programación PASCAL. El 
resultado en un test de programación posterior correlacionó más con la amplitud 
que con el conocimiento general o con un test de álgebra. 


Quizá el mayor apoyo a la amplitud de memoria de trabajo lo hicieron Kyllonen 
y Cristal (1990), quienes combinaron estadísticamente en un único factor de 
amplitud de memoria de trabajo medidas procedentes de una serie de tareas que 
requerían almacenar y manipular material simultáneamente, demostrando que 
este factor correlacionaba altamente con la capacidad de razonamiento, medida a 
través de tests tomados de baterías de inteligencia estándar. Engle et al. (1999a) 
obtuvieron un resultado similar en un estudio en el que observaron una alta 
correlación entre amplitud de memoria de trabajo y medidas de inteligencia 
fluida. Kyllonen y Christal sugieren que la principal diferencia entre las medidas 
de memoria de trabajo y las medidas de CI reside en que los tests de 
razonamiento son más sensibles a la experiencia cultural y educativa. Las 


medidas de memoria de trabajo tienden a verse menos influidas por la cultura, 
pero son más dependientes de la velocidad de procesamiento. Esto parece sugerir 
que estas medidas suponen una ventaja a la hora de seleccionar candidatos 
procedentes de distintos niveles culturales, de hecho este es el tipo de tareas a las 
que se enfrentan los seleccionadores de la Marina estadounidense. Quizá 
también sea significativo que la versión más reciente de la Escala Wechsler de 
Inteligencia para Adultos (WAIS) incorpore ahora un subgrupo de pruebas 
denominadas medidas de memoria de trabajo, aunque yo personalmente las 
consideraría como una mezcla entre las tareas basadas en el estudio de la 
memoria de trabajo y los tests existentes. 


10.4. ¿Qué mide la amplitud de memoria de trabajo? 


10.4.1. Enfoques correlacionales 


Dada la gran cantidad de funciones importantes que se pueden predecir gracias a 
la amplitud de memoria de trabajo, esta posee un claro valor práctico, pero, ¿qué 
está midiendo exactamente? ¿Podría tratarse simplemente de una breve y 
cuidada forma de combinar estimaciones de muchas funciones diferentes, o 
refleja la capacidad de un solo componente crucial de la cognición? Aunque el 
núcleo de la investigación se ha centrado en el empleo de esta medida 
simplemente como marcadora de un hipotético sistema de memoria de trabajo, 
una serie de estudios se han concentrado en intentar comprender qué es lo que 
hace que esta sencilla medida tenga este poder. Estos estudios han usado una 
serie de técnicas diferentes. Quizá la más simple consiste en manipular variables 
que concebiblemente incrementen o disminuyan la amplitud. Por ejemplo, 
LaPointe y Engle (1990) mostraron que la amplitud era menor cuanto mayores 
eran las palabras a recordar, lo que sugiere una posible contribución del bucle 
fonológico. Lobley et al. (2005) observaron que la similitud acústica entre 
palabras también reducía la amplitud, aunque esto depende de qué procesos de 
respuesta concretos se requieran, siendo relevante el tema de la estrategia. 
Finalmente, Tehan et al. (2001) obtuvieron efectos tanto de la longitud de 
palabra como de la similitud fonológica en tareas de amplitud simples así como 


complejas. 


A pesar de la popularidad de la amplitud de memoria de trabajo como medida, 
no existen procedimientos concretos aceptados generalmente, ni siquiera 
conjuntos de materiales, lo que dificulta que se puedan extraer conclusiones 
generalizables entre distintos estudios. En vista de esto, es de remarcar que 
muchos investigadores hayan tenido éxito replicando ampliamente los hallazgos 
de Daneman y Carpenter (1980). Sin embargo, la situación es menos 
tranquilizadora cuando empezamos a examinar efectos más sutiles. Por ejemplo, 
Baddeley et al. (1985) usaron un procedimiento de examen en grupo que 
requería que los sujetos comprobaran unas frases, pero que no las pronunciaran, 
consiguiendo replicar la asociación entre amplitud y comprensión lectora. Sin 
embargo, no encontraron efecto de la edad sobre el rendimiento, mientras que 
Lustig et al. (2001) sí encontraron efecto de la edad sobre algunas, aunque no 
todas las condiciones. 


Los estudios experimentales que demuestran que una variable u otra pueden 
estar influyendo de forma general sobre la amplitud de memoria de trabajo son 
valiosos a la hora de ofrecer pistas sobre cómo se ejecuta la tarea, lo cual es 
importante cuando se ponen en comparación estudios que usan paradigmas algo 
distintos. Es más, los métodos experimentales pueden proporcionar una prueba 
más directa de la hipótesis causal que los métodos correlacionales. La 
demostración de que una variable dada puede influir en el rendimiento en tareas 
de amplitud compleja puede ofrecer una posible interpretación de la correlación 
observada entre la amplitud y otras medidas cognitivas. Sin embargo, es 
enteramente posible que una variable influya en la amplitud, pero que su 
correlación con una tarea de rendimiento compleja no sea crucial. Dentro del 
modelo multicomponente de memoria de trabajo podría ocurrir, por ejemplo, que 
la amplitud se viera influida por el ejecutivo central y por el bucle fonológico, 
pero que su capacidad para predecir la cognición compleja descanse por entero 
sobre el componente ejecutivo. Por tanto, un paciente con un déficit muy puro en 
el bucle fonológico puede que tenga un rendimiento pobre en su amplitud de 
memoria de trabajo, pero pocos problemas con la comprensión del lenguaje (ver 
Caplan y Waters [1999], para una revisión de los estudios neuropsicológicos 
paralelos sobre amplitud). 


10.4.2. Combinando métodos experimentales con métodos correlacionales 


Un segundo enfoque más prometedor sobre el análisis de la amplitud de 
memoria de trabajo implica combinar métodos correlacionales y experimentales 
(Engle et al. , 1999a; Miyake et al. , 2001; Bayliss et al. , 2003). Este enfoque 
comienza examinado una gran muestra de sujetos en tareas sobre amplitud de 
memoria de trabajo. Después, se forma un grupo con los mejores sujetos y otro 
con los peores, y son comparados en la tarea que se esté investigando. Por 
ejemplo, Rosen y Engle (1994) estudiaron la capacidad para generar ítems a 
partir de categorías semánticas, pidiendo a sus sujetos que generaran tantos 
animales como les fuera posible en un tiempo limitado. Se sabe que esta tarea 
depende de la capacidad ejecutiva, que se encuentra deteriorada en pacientes que 
sufren daños en el lóbulo frontal (Milner, 1982), y que es fácilmente deteriorada 
por una tarea concurrente que absorba la capacidad del ejecutivo central 
(Baddeley et al. , 1984b). Tal como se pensaba, los sujetos con mayores 
amplitudes generaron más componentes de la misma categoría. A continuación, 
Rosen y Engle pidieron a sus sujetos que realizaran una tarea secundaria 
demandante, al mismo tiempo que generaban ítems. Esta tarea deterioró el 
rendimiento de los sujetos con mayores amplitudes, pero, en contra de lo 
esperado, no tuvo ningún efecto sobre los sujetos con amplitudes pequeñas. Una 
posible explicación es que los sujetos con mayores amplitudes usen 
habitualmente estrategias que demandan atención, para acentuar así el 
rendimiento. Estas estrategias son abandonadas al pedirles que realicen una tarea 
concurrente, y en consecuencia generan menos ítems. Los sujetos de pequeñas 
amplitudes no muestran un efecto de la tarea concurrente. Rosen y Engle 
sugieren que se debe a que estos sujetos no poseen una capacidad de memoria de 
trabajo suficiente como para desarrollar y emplear estrategias complejas. Por 
ello, una tarea secundaria que interrumpa estas estrategias tendrá un escaso 
efecto sobre su rendimiento. 


También es posible sugerir otras interpretaciones. Por ejemplo, otros factores 
como la falta de motivación, podrían causar que estos sujetos pusieran menos 
esfuerzo en la tarea de amplitud, y por tanto no se molestarían en desarrollar 
estrategias, incluso aunque fueran completamente capaces de desarrollarlas. De 
hecho, si los sujetos de amplitudes pequeñas son capaces de realizar la tarea de 
generación de categorías y la tarea secundaria sin un descenso en su 
rendimiento, entonces, al realizar la tarea de generación de categorías en 
solitario, habrían estado infrautilizando su capacidad atencional disponible. 


Si el mayor descenso en el rendimiento de la tarea secundaria en los sujetos con 
mayores amplitudes como consecuencia fuera resultado de un único 
experimento, sería menos preocupante. Sin embargo, el efecto ha sido 
demostrado por Engle y colegas a lo largo de una serie de tareas diferentes 
(Engle et al. , 1999b). Por tanto, aunque seleccionar grupos extremos podría 
tratarse de una estrategia económica que maximiza la posibilidad de detectar un 
efecto, también parece que maximiza la probabilidad de que se den diferencias 
estratégicas. Por supuesto, este es todavía un factor confuso, incluso cuando los 
estudios emplean a toda la población, en lugar de emplear solo a los extremos, 
ya que los distintos niveles de rendimiento en amplitud podrían, en principio, 
representar distintas proporciones de sujetos que usan una u otra estrategia. Sin 
embargo, esto parece relativamente menos probable que la presencia de un grupo 
absurdo de bajo rendimiento. No obstante, tal como vimos en la discusión del 
envejecimiento y la cognición, los problemas psicométricos pueden permanecer, 
incluso cuando se usa a toda la población. 


Afortunadamente, parece que se están empezando a desarrollar técnicas que 
permiten poner a prueba hipótesis específicas usando medidas sobre diferencias 
individuales. El nivel más básico de análisis consiste en observar simplemente 
las correlaciones entre los posibles predictores de la amplitud de memoria de 
trabajo, usando posiblemente la regresión múltiple para decidir qué medidas 
predicen la mayor cantidad de varianza única cuando se elimina la contribución 
de otras variables. Como vimos en el caso de los efectos de la edad, esto tiende a 
favorecer a las funciones que se puedan medir fiablemente, independientemente 
de que estas funciones sean intrínsecamente las más importantes. Esto crea un 
problema para las medidas del procesamiento ejecutivo, las cuales incluyen 
típicamente situaciones nuevas en las que hay menos probabilidad de obtener 
puntuaciones consistentes de un ensayo a otro, mientras que una simple tarea 
repetitiva como el tiempo de reacción de elección es más probable que 
proporcione puntuaciones consistentes y fiables. Es más, medidas como la 
velocidad de procesamiento pueden estar basadas en una gran cantidad de tareas, 
puede que ganen aún más fiabilidad. Finalmente, la regresión múltiple no se 
encuadra fácilmente en modelos específicos de los procesos subyacentes, algo 
que es claramente deseable en cualquier área tan compleja como la memoria de 
trabajo. 


Este último problema se aborda desde las distintas versiones de los modelos de 
ecuaciones estructurales, con los que se pueden proponer una serie de hipótesis 
específicas; siempre que los componentes subyacentes se puedan medir de forma 


adecuada, los modelos en competición pueden ponerse en comparación en 
cuanto a lo bien que explican los datos resultantes. Esto sigue sin aclarar el 
problema de la tendencia de las medidas ejecutivas a ser poco fiables. 
Afortunadamente, esto se puede abordar usando la técnica del análisis de 
variables latentes, una prometedora forma de desentrañar los componentes 
potenciales del ejecutivo central que se discutirá en el próximo capítulo. 


Sin embargo, a pesar de los futuros éxitos en el análisis de la amplitud de la 
memoria de trabajo, no hay duda de que ha demostrado ser un predictor muy 
poderoso de una gran serie de actividades cognitivas. Si la consideramos 
puramente como una medida psicométrica pragmática, posee una serie de 
ventajas sobre otras pruebas más tradicionales. Ofrece una serie de pruebas 
cortas que no dependen demasiado del conocimiento previo, y como tal, está 
empezando a influir sobre los enfoques psicométricos más tradicionales. 
Además, está mucho más relacionada con la psicología cognitiva actual que el 
enfoque clásico de la inteligencia. Sin embargo, si esta unión fuera fructífera, 
necesitaríamos saber por qué y cómo funcionan las tareas de amplitud de 
memoria de trabajo. Esto se tratará en el próximo capítulo. 


CAPÍTULO 11 


¿Qué límites tiene la amplitud de memoria de trabajo? 


La amplitud de memoria de trabajo, medida típicamente a través de tareas que 
requieren combinar el almacenamiento a corto plazo y la manipulación de 
información, es Capaz de predecir un notable rango de tareas cognitivas 
complejas. Por ello, debe implicar uno o más procesos cognitivos muy 
importantes. ¿Qué procesos podrían ser? Recientemente, una serie de grupos de 
investigación han intentado ir más allá de la simple demostración del poder 
predictivo de la amplitud de MT y han analizado sus componentes, comenzando 
por hipótesis unitarias que acentúan factores generales como la velocidad y la 
inhibición, y siguiendo con interpretaciones más complejas que influyen 
directamente sobre el modelo multicomponente de MT. Discutiremos estas 
interpretaciones por turnos, y a continuación ofreceremos una explicación de la 
aplicación del concepto de MT al análisis de las diferencias individuales en los 
éxitos académicos. 


11.1. La hipótesis de la velocidad 


Como vimos en el capítulo anterior, el concepto de velocidad de procesamiento 
ha jugado un papel prominente en los intentos de explicar los efectos de la edad, 
y también se ha propuesto como un posible determinante básico de la capacidad 
de memoria de trabajo. Case et al. (1982) desarrollaron una medida que 
denominaron amplitud de recuento. Esta medida consistía en presentar una serie 
de cartas, cada una con una serie de objetos. La tarea del sujeto consistía en 
contar los ítems de cada carta y después recordar el total de ítems en cada carta, 
estableciendo la amplitud como el mayor número de cartas que se podían 
procesar correctamente y los totales recordados. Case et al. encontraron que la 
amplitud aumentaba sistemáticamente con la edad, al igual que la velocidad de 


recuento. Sugirieron una compensación entre la demanda de procesamiento y la 
de recuerdo. A medida que el procesamiento fuera más fluido, habría más 
atención disponible para el recuerdo. Finalmente, enseñaron a sus sujetos adultos 
a contar usando nombres distintos para los números, una actividad que con la 
práctica podrían ejecutar perfectamente, aunque de forma lenta. Bajo estas 
circunstancias su amplitud fue equivalente a la de los niños que cuentan a esa 
velocidad cuando usan dígitos normales. Case et al. supusieron que la 
capacidades mentales básicas son constantes durante el desarrollo, pero las 
habilidades aprendidas como contar mejoran de forma constante con la práctica, 
dando lugar a una mejora en el rendimiento a medida que nos hacemos mayores. 


Los estudios posteriores que usan medidas más convencionales de la amplitud de 
memoria de trabajo se han propuesto poner directamente a prueba la hipótesis de 
la velocidad. Usando un diseño de regresión por pasos, Engle et al. (1992) 
mostraron que la correlación entre la velocidad y la comprensión lectora 
desaparecía cuando la amplitud de memoria de trabajo covariaba, mientras que 
la correlación entre amplitud y comprensión permanecía significativa después de 
controlar los efectos de la velocidad. Este resultado descartaba a la velocidad de 
procesamiento como base de la correlación entre la memoria de trabajo y la 
comprensión. Kyllonen y Stephens (1990) llegaron a una conclusión similar. 
Bayliss et al. (2005a) estudiaron el desarrollo de la amplitud de memoria de 
trabajo entre los 6 y 10 años, usando tareas específicamente diseñadas para 
obtener medidas de la velocidad y de la capacidad de almacenamiento por 
separado. Encontramos pruebas de la separación entre la velocidad de 
procesamiento general y los componentes de almacenamiento, aumentando la 
capacidad de ambos con la edad. Además, encontramos un tercer factor que 
compartía varianza tanto con la velocidad como con el almacenamiento y que, 
por tanto, la velocidad o las medidas de almacenamiento complejas 
correlacionaban más con la lectura y las matemáticas y con la inteligencia 
medida a través del test de matrices de Raven. Rechazamos las interpretaciones 
basadas solo en la velocidad. 


11.2. La hipótesis del fondo de recursos 


11.2.1. ¿La capacidad de procesamiento es general? 


Un supuesto mantenido por Case et al. y compartido por Daneman y Carpenter 
(1980), y de hecho por una gran cantidad de investigadores de este campo, era 
que la memoria y el procesamiento hacen uso de un fondo de recursos 
atencionales generales. Si esto es así, entonces, cuanto mejor sea el sujeto 
procesando frases, más capacidad podrá dedicar a la memoria, y viceversa. En 
los últimos años, este supuesto se ha cuestionado cada vez más. Una de las 
primeras sugerencias de la falsedad de este supuesto provino de un estudio de 
Hitch y Baddeley (1976). Realizaron un análisis detallado de un estudio en el 
que una tarea de razonamiento verbal se combinaba con una tarea concurrente de 
recuerdo serial de dígitos. Un supuesto implícito del modelo de Baddeley y 
Hitch (1974) era que ambas tareas hacían uso del mismo sistema ejecutivo de 
capacidad limitada. Para un nivel de dificultad dado, los sujetos podían dedicar 
más atención al razonamiento, dando lugar a una respuesta más rápida, a 
expensas de una mayor tasa de error de memoria, o viceversa. Por tanto, cuando 
el nivel de dificultad se mantiene constante, deberíamos encontrar una 
correlación negativa entre las dos subtareas, mayores tasas de error asociadas a 
un razonamiento más rápido. De hecho, se encontró exactamente lo contrario. 
Esto se interpretó sugiriendo que cuando el procesamiento se llevara a cabo 
suavemente, ambas tareas se realizarían sin error. Sin embargo, cuando una de 
ellas tuviera dificultades por cualquier causa, captaría la atención a expensas de 
la otra, dando lugar a un deterioro en las dos, y a una correlación positiva. 


Más evidencias de la independencia potencial del almacenamiento y el 
procesamiento provienen de un estudio de Duff y Logie (2001). Ellos 
manipularon estos dos aspectos de forma independiente en una tarea en la que 
los sujetos tenían que realizar operaciones aritméticas de distinta dificultad, a la 
vez que recordaban secuencias de palabras sueltas. En contra de la hipótesis de 
los recursos compartidos, no encontraron evidencias de que el recuerdo de 
palabras se viera influido por la dificultad de las operaciones, pero sí de un 
efecto de la longitud de la demora impuesta entre la presentación de las palabras 
y el test. Tampoco hubo evidencias de que un incremento en la carga de palabras 
hiciera la tarea aritmética más lenta o menos precisa. En un estudio posterior de 
Cocchini et al. (2002) mostraron que la capacidad de los sujetos para recordar 
una secuencia de dígitos no se veía afectada por el hecho de tener que codificar y 
recordar un patrón de matrices visuales mostrado entre la presentación de las 
palabras y el test. De forma similar, recordar un patrón visual no se vio afectado 
por el hecho de tener que codificar y recordar una secuencia de dígitos mostrada 


entre la presentación visual y el test. Estos resultados implican que el 
rendimiento en estas tareas refleja principalmente el funcionamiento de los 
subsistemas visoespacial y fonológico de forma independiente, y no sobre un 
fondo común de capacidad ejecutiva. Por supuesto, esto no implica 
necesariamente que este sea el caso de otras tareas cuyo rendimiento esté 
limitado por el ejecutivo, en vez de por la capacidad de almacenamiento. 


11.2.2. ¿Almacenamiento o procesamiento? 


Towse y Hitch (1995; Towse et al. , 1998) intentaron separar los componentes de 
procesamiento y almacenamiento de la tarea de amplitud de recuento de Case et 
al. , manipulando de forma independiente la velocidad con la que los sujetos 
podían ejecutar la tarea de recuento y la demora transcurrida antes del recuerdo. 
Encontraron que la amplitud de recuento era sensible a la demora, pero no a la 
carga atencional. En un estudio posterior, Hitch et al. (2001) compararon dos 
condiciones, ambas incluían la misma cantidad de componentes sencillos, y por 
tanto rápidos, y de componentes difíciles (lentos). En una condición, las demoras 
cortas aparecían al principio de la secuencia de operaciones, y terminaban con 
una demora larga, mientras que la otra condición tenía el orden contrario. Hay 
que tener en cuenta que cuando una demora larga aparece al final, todos los 
ítems sufrirán la demora impuesta, mientras que en el orden contrario, los 
últimos ítems no sufrirán una demora larga, por lo que la longitud media de 
demora a lo largo de toda la secuencia será menor. Esta predicción basada 
temporalmente contrasta con la hipótesis del procesamiento, ya que la cantidad 
de procesamiento total es la misma independientemente del orden. Tal como 
pronosticó la hipótesis del almacenamiento, la amplitud fue consistentemente 
mayor cuando las demoras largas tenían lugar al principio y el tiempo medio de 
almacenamiento por ítem era mínimo. Por consiguiente, Hitch et al. rechazaron 
la interpretación del fondo atencional limitado, sugiriendo, en cambio, que los 
sujetos alternan entre tareas de memoria y tareas de recuento, estando la 
amplitud determinada por la cantidad de olvido que se da durante el recuerdo. 


Saito y Miyake (2004) desafiaron esta interpretación. Primero replicaron los 
hallazgos básicos de Towse et al. (1998) pero empleando adultos en lugar de la 
muestra de niños que se había empleado en el primer estudio. Realizaron dos 


experimentos más. En uno, la demora se mantenía constante, pero la cantidad de 
procesamiento variaba según el ritmo de presentación de los ítems establecido 
por el experimentador. En el otro, la cantidad de procesamiento se mantuvo 
constante mientras que el tiempo se modificó. En ambos casos el rendimiento 
estuvo relacionado con la cantidad de procesamiento requerido y no con el 
tiempo transcurrido. Interpretaron sus resultados de acuerdo con la importancia 
del recuerdo de los ítems, pero sugiriendo que el olvido es resultado de la 
interferencia y no de la demora. 


El tema se complica por un estudio reciente de Lépine et al. (2005), quienes 
compararon la capacidad de los dos tipos de medidas para predecir las 
puntuaciones en Literatura y en Matemáticas. Emplearon dos medidas estándar 
de amplitudes complejas, la amplitud de lectura y la amplitud de operaciones, 
junto con dos tareas nuevas que eran aparentemente simples, pero que se 
presentaban a un ritmo acelerado. Una tarea consistía en recordar una serie de 
números, tras cada uno de ellos se leía una secuencia de cuatro, cinco o seis 
letras. La segunda tarea consistía en recordar una secuencia de letras, cada una 
seguida de una sencilla tarea aritmética, lo cual significaba que los sujetos tenían 
que leer en voz alta y luego decir la suma de la operación (e.g., W. 9, +1, —1, +1, 
+1: el sujeto contesta 10: K 7, -1, —-1, etc.). Encontraron una mayor correlación 
entre el rendimiento académico y sus simples tareas que la encontrada con las 
medidas de amplitudes complejas convencionales. La aparente simplicidad de 
sus tareas básicas, junto con el estricto control de procesamiento, les llevó a 
rechazar factores estratégicos, e interpretaron sus resultados en términos de una 
capacidad de procesamiento básica. Sin embargo, el problema de seguir un ritmo 
acelerado, tal como se usó en este estudio y en el de Saito y Miyake (2004), es 
cómo se las arreglan los sujetos cuando el rendimiento comienza a descender — 
un tema altamente complejo—. Esta controversia está lejos de resolverse. 


También debemos tener en cuenta una serie de advertencias. En primer lugar, el 
papel concreto de alternar unas tareas con otras, a diferencia del rendimiento 
simultáneo típico, puede variar sustancialmente, según las condiciones 
experimentales concretas. Según el modelo de memoria de trabajo, una tarea 
compleja como la amplitud de frase, probablemente depende del bucle 
fonológico y del ejecutivo central. Sin embargo, es totalmente posible que la 
capacidad predictiva para la función cognitiva dependa principalmente de su 
carga ejecutiva. Engle (1996) propuso una interpretación como esta, con una 
modificación, él remarcó la importancia de la atención para la capacidad de 
inhibir el material irrelevante. 


11.3. La hipótesis de la inhibición 


La idea de que la inhibición puede ser un componente importante de la 
capacidad de memoria de trabajo no es nueva. Es evidente que los pacientes con 
un daño en el lóbulo frontal exhiben a menudo problemas ejecutivos y un 
comportamiento desinhibido (Shallice, 1988; Stuss y Knight, 2002). Es más, 
Norman y Shallice (1986) proponen que su sistema SAS controla el 
comportamiento a través de sus capacidades inhibitorias. Una de las evidencias 
más fuertes acerca de la importancia de la inhibición como determinante del 
rendimiento cognitivo más generalmente es la de Lynn Hasher y Rose Zacks 
(1988), quienes han sugerido que la mayor parte del declive cognitivo asociado a 
la edad puede reflejar una capacidad reducida para la inhibición. Lustig et al. 
(2001) usaron este marco de trabajo para interpretar el descenso del rendimiento 
en las tareas de amplitud de memoria de trabajo que a menudo aparece en los 
ancianos. Sugieren que la dificultad para inhibir información irrelevante en la 
tercera edad puede hacerles particularmente proclives a la interferencia 
proactiva. La forma habitual de examinar la amplitud consiste en comenzar con 
una o dos frases, incrementando gradualmente el número de frases hasta que el 
rendimiento baja. Lustig et al. proponen que en este punto del experimento se 
habrá generado una considerable IP a partir de los éxitos de los ensayos 
anteriores. Por otro lado, si la prueba comienza justo un nivel por encima de la 
amplitud, entonces los sujetos serán examinados en su máximo rendimiento 
antes de que se pueda haber generado gran cantidad de IP. Tal como se pensaba, 
los sujetos ancianos rindieron mejor cuando se comenzó con secuencias largas. 
Los sujetos jóvenes no obtuvieron ninguna ventaja de esta manipulación, pero sí 
les ayudó que los ensayos estuvieran separados por una breve pausa, una 
situación que se ha comprobado en la tarea del olvido a corto plazo de Peterson 
que minimiza la interferencia proactiva (Loess y Waugh, 1967). 


11.3.1. Efectos de la interferencia en la memoria de trabajo 


El papel de la inhibición ha sido explorado por Cantor y Engle (1993), con 


sujetos de altas y bajas amplitudes que ejecutaban una tarea de comprobación de 
hechos empleando el efecto abanico. Este efecto consiste en enseñar a los sujetos 
una serie de hechos inventados, por ejemplo, el marinero está en el parque, el 
cura está durmiendo, el alcalde está en la barca. En la condición abanico, una 
serie de estas acciones son asignadas a una misma persona, por ejemplo, el 
soldado está en la barca, el soldado está en el parque, el soldado está durmiendo. 
Después se le presenta una frase y se le pregunta si es verdadera o falsa. El 
tiempo de comprobación aumenta con el tamaño del abanico, esto es, con el 
número de acciones asociadas a un mismo sujeto. Cantor y Engle (1993) 
demostraron que el efecto abanico era mayor en los sujetos de menores 
amplitudes, presumiblemente por su menor capacidad ejecutiva. 


Conway y Engle (1994) buscaron una explicación más detallada de los procesos 
que subyacen a este resultado, apreciando una similitud entre el efecto abanico, 
en el que el tiempo de comprobación aumenta con el número de frases 
enlazadas, y la observación de Sternberg (1966) de que el tiempo de reacción 
aumenta de forma lineal con el número de ítems a recordar. En el paradigma de 
Sternberg se muestra a los sujetos una lista de dígitos, y después se les pide que 
digan, tan rápido como puedan, si un dígito dado pertenece o no a la serie 
presentada recientemente. En los sujetos de menor amplitud examinados bajo 
este procedimiento, la curva que relaciona el tamaño de la lista con el tiempo de 
reacción fue más empinada. Esto sugiere que su reducida capacidad les hace ser 
más susceptibles al coste que supone almacenar y/o recuperar los dígitos. Sin 
embargo, un experimento posterior añadió importantes restricciones a esta 
interpretación. La tarea de Sternberg usa repetidamente los mismos dígitos en 
secuencias de cualquier longitud. Este fue el procedimiento empleado en el 
estudio inicial de Conway y Engle. En un estudio posterior, sin embargo, se 
aseguraron de que cada lista contuviera ítems diferentes, por ejemplo, la lista de 
tamaño uno podría contener el dígito 5; la lista de tamaño dos, los dígitos 1 y 8, 
y la de tamaño cuatro, los dígitos 2, 4, 7 y 9. Bajo estas circunstancias las curvas 
fueron equivalentes para los sujetos de altas y bajas amplitudes. Conway y Engle 
concluyeron que el factor crucial que hacía la tarea especialmente difícil para los 
participantes de menor amplitud era la necesidad de evitar la posible 
competición que se da cuando aparece un mismo dígito en listas diferentes. En 
resumen, los sujetos de menor amplitud eran más susceptibles a la interferencia 
proactiva, es decir, a la dificultad que supone decidir si un ítem proviene de la 
lista que se está poniendo a prueba en ese momento o proviene de una lista de 
dígitos previa. 


Kane y Engle (2000) pusieron a prueba esta hipótesis en un estudio de memoria 
en el que usaban un diseño clásico de IP. Los sujetos tenían que recordar tres 
listas diferentes. Cada lista estaba compuesta por diez ítems, de los que uno de 
ellos procedía de una categoría semántica de entre diez categorías posibles, 
como, por ejemplo, animales o profesiones. Se examinó a sujetos de altas y bajas 
amplitudes, y, tal como se esperaba, todos mostraron un recuerdo 
progresivamente más pobre a lo largo de las tres listas, el clásico efecto de la IP. 
Sin embargo, mientras que los dos grupos se comportaron de forma equivalente 
en el recuerdo de la Lista 1, los sujetos de menor amplitud, tal como se 
pronosticó, mostraron un declive en el rendimiento a medida que se iban 
presentando las listas, demostrando una mayor susceptibilidad a la interferencia. 


Conway et al. (2001) también mostraron que esta susceptibilidad a la 
interferencia no estaba limitada a la memoria. Pidieron a sus sujetos que 
escucharan detenidamente un mensaje seguido pronunciado en alto, repitiendo 
las palabras presentadas en un oído e intentando ignorar el mensaje con el otro 
oído. Entre medias de este mensaje ignorado, se mencionaba el nombre del 
sujeto unas cuantas veces, un estímulo que, según había demostrado Moray 
(1959), impide que el oído logre desatenderlo y hace que sea percibido. Cuando 
después se les preguntó, el 65 por ciento de los sujetos de menor amplitud 
confesaron haber escuchado su nombre, frente al 20 por ciento de los sujetos de 
mayores amplitudes, quienes presumiblemente tuvieron más éxito a la hora de 
inhibir el mensaje no deseado y no ser consciente de él. 


Un ejemplo similar acerca de la mayor capacidad de los individuos de gran 
amplitud para inhibir información no deseada proviene de un estudio de Kane y 
Engle (2000) sobre el efecto Stroop. Este efecto aparece cuando la respuesta que 
se solicita al sujeto está en conflicto directo con una respuesta mucho más 
habitual. El caso clásico consiste en nombres de colores que están escritos con 
una tinta de distinto color. Entonces se pide al sujeto que diga el color con el que 
están escritos, por ejemplo, la palabra «azul» escrita en rojo. La respuesta 
correcta (rojo) es más lenta y menos correcta que cuando la palabra es neutra, o 
se usa una línea de equis en lugar del nombre de un color que se contradice con 
el de la tinta empleada. En este paradigma estándar se daba una modesta, aunque 
significativa, correlación entre la amplitud de memoria de trabajo y la velocidad. 
Sin embargo, cuando se cambió el patrón, de forma que la palabra que designaba 
el color y la tinta coincidían un 75 por ciento de las veces, los sujetos de bajas 
amplitudes mostraron una tendencia mucho más marcada a cometer errores en 
ese 25 por ciento de las veces en las que aparecía un estímulo Stroop 


inconsistente. Encontraron particularmente difícil la tarea de inhibir la respuesta 
dominante pero incorrecta, cuando la respuesta dominante era la correcta la 
mayoría de las veces. 


En respuesta a todas estas evidencias, Engle (1996) propuso la hipótesis de 
inhibición de recursos. Esta hipótesis sugiere que un amplio rango de actividad 
cognitiva depende de la capacidad para inhibir información en competencia o no 
deseada, o hábitos de respuesta. Se supone que este proceso es atencionalmente 
demandante. Se cree que lo que ocurre con las distintas tareas de amplitud de 
memoria de trabajo es que suponen un gran coste para la capacidad del sujeto 
que tiene que recordar los ítems relevantes en contra de una demanda contraria 
para procesar y resistir ítems previos en competición. Sin embargo, aunque 
Engle y sus colegas han contribuido enormemente a resaltar la importancia 
potencial de los procesos inhibitorios, al menos quedan dos cuestiones más. 
¿Hasta qué punto puede considerarse la inhibición como una función unitaria?, e 
incluso, si este es el caso, ¿es la única responsable de la capacidad predictiva de 
las medidas de amplitud de memoria de trabajo? Estas dos cuestiones se 
considerarán a continuación. 


11.3.2. ¿La inhibición es unitaria? 


A pesar de la popularidad del concepto de inhibición, y de las muchas medidas y 
fenómenos que supuestamente lo reflejan, no hay mucho acuerdo sobre su 
definición ni sobre su medición. Rabitt resume adecuadamente la situación: 


No hemos sido capaces de encontrar en nuestro laboratorio diferencias 
individuales comunes en cuanto a la inhibición, en una amplia serie de tareas 
idénticas a la tarea Stroop en cuanto a su lógica, pero superficialmente distintas 
entre sí. Es decir, no hemos podido encontrar pruebas de que la habilidad para 
inhibir respuestas a lo largo de una serie de tareas diferentes sea 
consistentemente mayor en unos individuos que en otros. 


(Rabbitt, 1997, pp. 12-13) 


El término inhibición se usa de muchas formas distintas. En el campo de la 
visión, por ejemplo, la inhibición lateral se refiere a un mecanismo sensorial que 
permite agudizar la percepción de los límites de una figura suprimiendo la 
activación de las células adyacentes para maximizar las células activas. Por otro 
lado, la inhibición de retorno se refiere a un fenómeno completamente diferente 
por el que típicamente los movimientos de los ojos no regresan al punto en el 
que acaban de posarse. En el campo de la generación aleatoria, cognitivamente 
más complejo, al menos aparecen dos efectos que parecen depender de la 
inhibición. 


Uno de ellos consiste en una potente tendencia a evitar la repetición inmediata 
de un mismo ítem, un efecto que parece ser implícito, y que no se ve influido por 
la tasa de generación ni por el tamaño de una carga cognitiva concurrente 
(Baddeley et al., 1998). Normalmente repetir un ítem facilita el procesamiento, 
un efecto conocido como facilitación positiva. Sin embargo, existe el peligro de 
crear un bucle de retroalimentación positiva por el que el organismo se 
encerraría en un ciclo de respuesta en el que cada respuesta se facilitaría a sí 
misma, dificultando aún más la salida del bucle de repetición. Una inhibición 
automática de la repetición inmediata evitaría este problema. 


Otro rasgo más de la generación aleatoria es la necesidad de inhibir respuestas 
estereotipadas, en el caso de las letras las secuencias alfabéticas como a b, o q r 
s, contar secuencias de dígitos, y en el caso de pulsar teclas, pulsar también la 
tecla correspondiente al mismo dedo de la otra mano (Baddeley et al. , 1998). A 
diferencia de cuando se evita la repetición, estos efectos aumentan con la 
velocidad de generación y con una carga concurrente, lo que indica que su 
inhibición requiere una atención activa. Aún no se ha resuelto la cuestión de si la 
inhibición implicada en esta situación depende de la misma capacidad que la 
inhibición que está implicada cuando nos centramos en un único estímulo en un 
ambiente ruidoso, o cuando intentamos recordar los ítems de la última lista en 
condiciones de IP con las listas similares previas. 


11.3.3. El enfoque multivariado de la inhibición 


La cuestión de si la inhibición es una función unitaria se ha tratado en un 
reciente estudio de Friedman y Miyake (2004) en el que se hace un excelente uso 
del análisis de variable latente, un procedimiento estadístico más adecuado que 
los métodos correlacionales previos, para poner a prueba hipótesis más 
complejas. Friedman et al. comienzan identificando tres tipos de inhibición 
potencialmente separables. El primero de ellos se refiere a la capacidad para 
inhibir una respuesta dominante, basada en un hábito anterior establecido. Esto 
fue estudiado empleando tres tareas, cada una de ellas reflejaban supuestamente 
una inhibición prepotente. La primera tarea implica el clásico paradigma Stroop, 
tal como se ha descrito antes. La segunda mide la capacidad para responder 
apropiadamente a una señal de stop que le indica al sujeto que tiene que inhibir 
una respuesta anteriormente planeada, mientras que la tercera tarea implica una 
tarea antisacádica. Esta medida aparentemente simple, pero poderosa, consiste 
en la tendencia automática de los ojos a moverse hacia un nuevo estímulo. 
Enfrenta dos condiciones: una es la prosacádica, en la que se pide a los sujetos 
que muevan sus ojos hacia un estímulo visual, y la otra, la condición 
antisacádica, en la que los ojos han de moverse en dirección opuesta tan rápido 
como sea posible (Hallett, 1978). Para poder hacer esto, el sujeto tiene que 
inhibir la tendencia natural a fijar el indicio, en vez de la respuesta de 
localización enseñada. Roberts et al. (1994) mostraron que la condición 
antisacádica se veía deteriorada diferencialmente por una tarea concurrente, 
sugiriendo que dependía de un proceso con una capacidad atencional limitada. 
Esta conclusión se ve apoyada por la demostración de Guitton et al. (1985) de 
que el rendimiento antisacádico está deteriorado en pacientes con un daño en el 
lóbulo frontal, y por la observación de Sweeney et al. (1996) de que el 
rendimiento antisacádico está acompañado del incremento de la actividad en el 
córtex prefrontal dorsolateral. Finalmente, Kane et al. (2001) encontraron que 
los sujetos con amplitudes de memoria de trabajo altas y bajas rendían de forma 
equivalente en la tarea prosacádica, pero los sujetos de menores amplitudes 
respondían más lentamente y de forma menos precisa a las señales antisacádicas. 


Una segunda categoría de tareas empleada por Friedman y Miyake (2004) fue la 
de la inhibición distractora. Esta tarea se midió a su vez usando tres medidas 
distintas. La primera medida fue la tarea de los flancos de Eriksen y Eriksen 
(1974), en la que los sujetos tenían que identificar un ítem presentado 
visualmente, en solitario, o bien flanqueado por ítems irrelevantes 
potencialmente distractores. La segunda tarea de inhibición distractora consistía 
en nombrar palabras, mientras que una tercera tarea consistía en emparejar 
figuras, ambas tareas bajo condiciones de distracción. 


Se asumió que la interferencia proactiva era el nexo de unión con el tercer grupo 
de tareas. Una de estas tareas era la tarea de Brown-Peterson, en la que los 
sujetos recuerdan una secuencia corta de ítems a lo largo de una demora rellena, 
en la que se ha demostrado que el descenso del rendimiento depende 
crucialmente de la IP de los primeros ítems (Keppel y Underwood, 1962a; 
Wickens et al. , 1963). Una segunda tarea incluía el clásico paradigma de la IP 
procedente del aprendizaje verbal, en el que el sujeto aprende pares de ítems 
(condición A-B), seguido de otros pares en los que el mismo estímulo es 
emparejado con respuestas diferentes (A-C). La condición final incluía una tarea 
de recuerdo con indicios que implicaba de nuevo una condición de interferencia. 


El primer paso de Friedman y Miyake fue confirmar que efectivamente las 
distintas tareas intercorrelacionaban con otros miembros de la categoría 
propuesta, de forma que fuera posible asegurar que cada grupo ( cluster) se 
pudiera combinar en una única variable latente. Aunque la intercorrelación entre 
los distintos tests fue relativamente pequeña, las variables latentes fueron 
identificadas con éxito. El siguiente paso fue poner a prueba la hipótesis de que 
efectivamente representaban tres tipos distintos de inhibición. De hecho, se 
demostró que saturaban en dos categorías en lugar de tres, quedando mejor 
explicadas la respuesta de inhibición dominante y la inhibición distractora a 
través de una sola variable latente. Ambas fueron claramente independientes de 
la variable subyacente a las tareas de IP. 


El siguiente paso del análisis fue investigar la relación entre los dos tipos de 
inhibición identificadas y otra serie de capacidades, las cuales posiblemente 
estuvieran influidas por factores inhibitorios. Una de estas capacidades 
implicaba una tarea de cambio, donde se extrajo una variable latente a partir de 
tres tareas de cambio diferentes, una que implicaba un cambio de procesamiento 
de números a letras, otra que implicaba pasar de los rasgos locales a los rasgos 
globales dentro de una serie compleja, mientras que la tercera implicaba un 
cambio entre categorías semánticas. Según la medida concreta empleada, el 
cambio correlacionó entre 0,73 y 0,55 con la respuesta de inhibición dominante, 
pero no se relacionó con la IP. Este resultado no refleja simplemente una menor 
sensibilidad a las medidas de IP, ya que esta variable latente mostró una 
asociación significativa con un cuestionario que medía susceptibilidad a los 
pensamientos intrusivos ( r 0,36), mientras que la medida de respuesta 
dominante no correlacionó ( r -0,11). Sin embargo, la respuesta de inhibición 
dominante mostró una correlación significativa, aunque débil, con el 
Cuestionario de Fallos Cognitivos de Broadbent (Broadbent et al. , 1982), en el 


que se pedía a los sujetos que describieran los lapsus de acción y de atención 
diarios, mientras que la IP no se relacionó significativamente. 


Estos resultados parecen sugerir que se pueden identificar al menos dos formas 
de inhibición, y que estas juegan papeles distintos en una serie de importantes 
tareas. ¿Significa esto, por tanto, que Engle y Hasher tienen razón al acentuar el 
papel de la inhibición en la amplitud de memoria de trabajo? Afortunadamente, 
Friedman y Miyake han examinado la amplitud de lectura de sus sujetos. 
Encontraron que el rendimiento se relacionaba significativamente con ambas 
medidas de inhibición, aunque de forma relativamente modesta, para la respuesta 
dominante, r = -0,23, y para la IP, r = 0,33. No se encontró una asociación fiable 
entre las medidas inhibitorias y los errores de intrusión. 


El estudio de Friedman y Miyake probablemente sea una parte importante del 
trabajo, el cual si se replicara señalaría la posibilidad de usar el análisis de 
variable latente para probar hipótesis relativamente delicadas. El patrón de 
resultados observado es complejo pero coherente, sugiriendo que es poco 
probable que la amplitud de memoria de trabajo, con su capacidad para predecir 
el rendimiento en una serie muy variada de tareas cognitivas, se pueda 
interpretar adecuadamente en términos de una sola variable. 


11.4. Componentes de la memoria de trabajo 


11.4.1. ¿La memoria de trabajo es de dominio específico ? 


En su artículo inicial, Daneman y Carpenter (1980) asumieron que el sistema 
que estaban midiendo era específico del procesamiento del lenguaje, una 
cuestión que se hizo más explícita en un artículo de Daneman y Tardif (1987) en 
el que se constataban evidencias acerca de la separación entre la memoria de 
trabajo basada en el lenguaje y la memoria de trabajo visoespacial. Shah y 
Miyake (1996) presentaron un ejemplo más radical de este enfoque dicotómico. 
Además de la medida estándar de amplitud de lectura de la memoria de trabajo, 
también examinaron el rendimiento en una segunda medida de amplitud basada 
en una combinación entre la manipulación espacial y la memoria, encontrando 


que la amplitud de lectura pronosticaba la comprensión lectora, pero no 
pronosticaba medidas de habilidad espacial, mientras que la amplitud espacial 
mostró el patrón contrario. 


Turner y Engle (1989) consideraron un concepto algo más general de la 
capacidad de memoria de trabajo, desarrollando una tarea denominada amplitud 
de operación, en la que los sujetos tenían que realizar una secuencia de 
operaciones aritméticas simples, cada una seguida de una palabra suelta, que 
posteriormente debía recordarse. Al igual que en la tarea de amplitud de lectura, 
se determinó la amplitud a partir de la máxima longitud con la que se podían 
recordar todas las palabras correctamente. Turner y Engle encontraron que esta 
tarea predecía la comprensión lectora casi igual de bien que la tarea estándar de 
amplitud lectora, sugiriendo que dado que esta tarea dependía de la comprensión 
aritmética, no lingúística, esto implicaba que la amplitud de memoria de trabajo 
refleja una capacidad ejecutiva general en vez de una capacidad específica del 
lenguaje. Kyllonen y Christal (1990) adoptaron un enfoque similar, revisando 
una serie de tareas de memoria de trabajo de Kane et al. (2001) y de Engle et al. 
(1999), quienes mostraron una fuerte asociación entre la amplitud de memoria de 
trabajo y el rendimiento en la tarea antisacádica, en la que los sujetos tienen que 
responder desviando su mirada lejos del lugar de un indicio visual. Parece, por 
tanto, como si las dos tareas de un dominio verbal y visoespacial totalmente 
distinto tuvieran un componente común. Engle et al. resumen su postura de la 
siguiente forma: 


Al igual que en la investigación sobre la inteligencia, los factores de memoria de 
trabajo generales parecen explicar demasiada varianza (en cuanto a las 
diferencias individuales en cognición) como para ser ignorados. Sin embargo, en 
algunos estudios (e.g., Shah y Miyake, 1996), además de la varianza explicada 
por un factor general, aún queda varianza significativa por explicar. Nosotros 
sugerimos que la evidencia conductual, neuropsicológica y neuroanatómica, 
apoya este enfoque jerárquico de la memoria/atención de trabajo. Los factores 
específicos se corresponden de forma primaria con el dominio de la información 
que se tiene que almacenar, pero el factor general trasciende al domino del 
procesamiento. 


(Engle et al. , 1999a, p. 125) 


Por supuesto, el modelo de memoria de trabajo de Baddeley y Hitch (1974) 
representa un ejemplo de este modelo. Sin embargo, este modelo 
multicomponente ha emergido principalmente a partir de estudios 
experimentales que emplean métodos de doble tarea, junto con evidencias 
neuropsicológicas. ¿Hasta qué punto el marco de trabajo inicial de Baddeley y 
Hitch (1974) podría sobrevivir a un examen más detallado usando un enfoque 
basado en las diferencias individuales? Tal como se deduce de la revisión 
anterior, el enfoque de memoria de trabajo basado en las diferencias individuales 
ha tendido a centrarse en aspectos más ejecutivos del sistema, además de 
emplear principalmente métodos correlacionales en vez de experimentales, 
combinando datos procedentes de múltiples tests y empleando análisis 
estadísticos basados en modelos de ecuaciones estructurales. Sin embargo, a 
menudo se da el caso de que estos estudios tienen en cuenta a la MCP verbal y 
visoespacial, así como procesos ejecutivos más generales. 


11.4.2. Modelos de ecuaciones estructurales para la memoria de trabajo 


Engle et al. (1999) examinaron a 133 sujetos en una serie de tareas sobre 
amplitud de memoria de trabajo, memoria verbal a corto plazo y medidas 
estándar de inteligencia. La MCP verbal se midió usando la amplitud de palabra 
para ítems iguales y distintos, mientras que otras tareas de memoria verbal 
incluían amplitud de palabras de adelante hacia atrás y recuerdo libre, las cuales 
se dividían en componentes a largo plazo y componentes de recencia. Las 
medidas de memoria de trabajo incluían la amplitud de operaciones, en la que se 
presentaban una serie de problemas aritméticos simples y a continuación 
palabras que luego debían recordar, y pruebas de amplitud de lectura estándar. 
También incluían una medida del rendimiento en producción aleatoria. 
Finalmente, la inteligencia no verbal fue medida mediante el Test de Matrices 
Progresivas de Raven y el Test de Factor G de Cattell. 


Engle et al. usaron el análisis de factor exploratorio y confirmatorio para 
comprobar la supuesta categorización de los tests en grupos separados. También 
usaron el análisis de variable latente para extraer la varianza compartida de estos 


grupos ( cluster) y los modelos de ecuaciones estructurales para estudiar la 
relación entre ellos. Los resultados de estos análisis se muestran en la Fig. 11.1. 
Se observó una varianza compartida entre el cluster de memoria a corto plazo y 
el de memoria de trabajo, los dos asociados con la inteligencia. Sin embargo, 
cuando se controló el efecto de la memoria de trabajo, el factor de MCP dejó de 
correlacionar con la inteligencia, mientras que la memoria de trabajo siguió 
correlacionando de forma sustancial, r = 0,50, a pesar de haber controlado el 
efecto de la memoria verbal a corto plazo. No encontraron evidencias de que el 
efecto de recencia en el recuerdo libre correlacionara con la memoria a corto 
plazo, de forma consistente con la idea de que no constituye una tarea estándar 
del bucle fonológico, como de hecho sugirieron Baddeley y Hitch (1974), como 
discutimos en el Capítulo 6. Aparentemente la producción aleatoria no se 
relacionó estrechamente con ninguna de las otras medidas. Volveremos a este 
punto más tarde. 


Fig. 11.1. Un modelo de rutas que relaciona la memoria de trabajo, la MCP y la 
inteligencia fluida. Se ha eliminado la varianza común a la MCP y la MT. Las 
líneas curvas representan las correlaciones entre la gF (inteligencia fluida) y los 
residuos para la MCP y MT. Sin embargo, hay que tener en cuenta que todas las 
tareas de MCP fueron de naturaleza verbal. Datos de Engle et al., Modelos de 
Memoria de Trabajo, 1999 p. 109. 


Engle et al. interpretaron sus resultados en términos de un modelo jerárquico, 
proponiendo un sistema compuesto por un fondo de capacidad atencional 
limitada, apoyado por un sistema de almacenamiento verbal temporal; ellos 
percibieron que su propuesta tenía ciertos rasgos en común con el modelo 
original de Baddeley y Hitch. 


Miyake et al. (2001) llevaron a cabo un análisis de variable latente ampliamente 
equivalente, que acentuaba medidas visoespaciales en lugar de verbales. 
Examinaron a sus sujetos en una serie de tareas seleccionadas para medir el 
rendimiento ejecutivo; también incluyeron tareas que pronosticaron que 
reflejarían el almacenamiento visoespacial a corto plazo y otras cuyo objetivo 
era medir la manipulación visoespacial. Las tareas ejecutivas consistieron en la 
Torre de Hanoi, en la que los sujetos debían resolver un problema espacial que 
requería planificación y visión de futuro, mientras que una segunda tarea 
implicaba la producción aleatoria. La manipulación se midió usando una tarea 
que requería comparar letras rotadas junto con una tarea de manipulación 
espacial de una matriz de puntos. Una primera tarea de MCP visoespacial era la 
del golpeo de bloques de Corsi, en la que el experimentador golpea un recorrido 
a través de una serie de bloques, que luego ha de imitar el sujeto. Una segunda 
tarea requería que el sujeto recordara y reprodujera una serie de puntos dentro de 
una matriz. 


El análisis de variable latente sugirió que las tareas de memoria a corto plazo 
visual y las de memoria de trabajo visoespacial estaban mucho más 
estrechamente relacionadas con el procesamiento ejecutivo que la MCP verbal 
que habían encontrado Engle et al. Sus datos se ajustaron a un simple modelo de 
dos factores, estando asociadas a la memoria a corto plazo y la memoria de 
trabajo, y siendo independientes del procesamiento ejecutivo sin necesidad de 


almacenamiento memorístico. Logie (1995) también observó que la MCP 
visoespacial parece demandar más atención que la MCP verbal. 


Los estudios de Engle et al. y de Miyake et al. son ampliamente consistentes con 
la propuesta de Baddeley y Hitch de un sistema ejecutivo multimodal ayudado 
por los subsistemas verbal y visoespacial que proporcionan un almacenamiento 
temporal. Sin embargo, las diferencias aparecieron entre estas dos fuentes de 
evidencia, Miyake et al. (2001) encontraron claras evidencias de una memoria 
visoespacial independiente, y Engle et al. (1999) encontraron una MCP verbal 
independiente. Esto está reflejando presumiblemente las tareas concretas 
empleadas en los dos estudios: aunque hubiera sido claramente deseable tener 
ambos componentes de la MCP reflejados en el mismo estudio. 


Bayliss et al. (2003) intentaron lograr esto usando una serie de tareas nuevas en 
las que explícitamente se equiparaban cuidadosamente las tareas visoespaciales 
y las verbales proporcionando medidas distintas de la eficacia del 
procesamiento, del almacenamiento y de su combinación, tal como se refleja en 
las tareas de amplitud verbal y visoespacial complejas. Se llevaron a cabo dos 
estudios, uno con niños de ocho años y el otro con estudiantes universitarios. 
Ambos dieron claras muestras de un componente de dominio general que 
reflejaba la eficacia del procesamiento, junto con dos componentes de 
almacenamiento de dominio específico, uno verbal y el otro visoespacial. 
También había un componente residual, el cual sugirieron que podía reflejar la 
capacidad para coordinar dos tareas simultáneas. Bayliss et al. (2003) 
concluyeron que sus resultados eran consistentes con la interpretación de una 
amplitud de memoria de trabajo compleja en términos de un fondo de recursos 
único compartido por el almacenamiento y por el procesamiento. Sin embargo, 
los datos eran completamente consistentes con un modelo multicomponente que 
distingue por un lado entre sistemas de almacenamiento a corto plazo 
visoespacial y verbal de dominio específico y, por otro lado, un sistema de 
procesamiento ejecutivo limitado atencionalmente de dominio general. 


Por tanto, parece que cada vez hay un mayor grado de acuerdo acerca de la 
existencia de componentes separados que están coordinados por algún tipo de 
sistema general limitado atencionalmente. Para resumir el enfoque de unos diez 
teóricos de la memoria de trabajo, después de unos cuantos días de debate, 
Miyake y Shah escribieron: 


Declaramos el abandono total de un enfoque completamente unitario de la 
memoria de trabajo... En vez de debatir si la memoria de trabajo es unitaria o 
no, la clave sería especificar la(s) fuente(s) de los efectos de dominio específico 
encontrados tanto en los estudios experimentales (e.g., doble tarea) como en los 
estudios correlacionales. 


(Miyake y Shah, 1999, p. 449) 


11.4.3. Repercusión para las teorías de memoria de trabajo 


¿Los sofisticados análisis de variable latente han revelado algo que aún no se 
supiera? Así será si demuestran ser replicables y generalizables. Por ejemplo, la 
sugerencia de que la memoria verbal a corto plazo es mucho más fácilmente 
separable de los procesos ejecutivos que la memoria visoespacial, da sentido al 
conjunto de los datos disponibles, y requiere explicación. Una posibilidad es que 
el repaso en la memoria verbal sea menos demandante atencionalmente que el 
equivalente visoespacial. Baddeley (2000) sugirió que, aunque el repaso en el 
búfer episódico y en el sistema visoespacial implica poner una continua atención 
al material que se repasa, mantener material usando el bucle fonológico demanda 
mucha menos atención. La razón es que el material verbal familiar, como los 
dígitos o las palabras, puede regenerarse literalmente mediante el habla, 
encubierta o en alto. Es más, si el material recordado implica un conjunto 
limitado de ítems sobreaprendidos como los dígitos, el conocimiento a largo 
plazo se puede usar para «limpiar» la huella de memoria durante los continuos 
repasos o en la recuperación final. Es más probable que la MCP visoespacial 
incluya material no familiar como patrones matriciales nuevos, los cuales no 
permiten ninguna de estas estrategias. 


Un interesante uso potencial del análisis de variable latente es que proporciona 
una explicación más detallada de los subprocesos implicados en la memoria de 
trabajo. Como se discutió anteriormente, el análisis del concepto de inhibición 
de Friedman y Miyake (2004) ha empezado a fraccionar este complejo concepto 
en componentes separados, identificando las tareas que son relevantes y 
mostrando qué habilidades cognitivas están influidas por estos componentes. 
Miyake et al. (2000) proporcionan un buen ejemplo de las posibilidades de este 


método, abordando el complejo aunque crucial tema de hasta qué punto se 
pueden fraccionar los procesos ejecutivos. 


11.5. Fraccionamiento del ejecutivo central 


Como vimos anteriormente, los estudios que emplean métodos correlacionales 
simples con pacientes neuropsicológicos o con pacientes normales y que 
emplean tareas del «lóbulo frontal» clínicamente desarrolladas, han generado 
típicamente resultados decepcionantes, con muchas correlaciones positivas entre 
las tareas, pero con una magnitud raramente superior a 0,3 (Duncan et al. , 1996; 
Shallice y Burgess, 1996). Esto refleja probablemente una serie de problemas: 


1. Que el ejecutivo es multicomponente; 


2. que depende en su mayor parte, aunque seguramente no del todo, de los 
lóbulos frontales; 


3. que esta es un área del cerebro compleja y grande, que casi con toda seguridad 
también es responsable de otros procesos y, finalmente, 


4, que habitualmente los procesos ejecutivos se movilizan en orden para tratar 
situaciones fuera de lo habitual que podrían requerir estrategias diferentes en 
momentos distintos, proporcionando así puntuaciones poco fiables en los tests 
(Rabbitt, 1997). 


Por tanto, el análisis de variable latente, que es capaz de extraer la varianza 
común incluso de tareas cuya fiabilidad es algo baja, es totalmente apropiado 
para este problema. 


Miyake et al. (2000) comenzaron proponiendo una serie de posibles subprocesos 
ejecutivos y seleccionando algunas medidas de cada uno, después confirmaron 
que cada uno de ellos se agrupaba alrededor de lo que razonablemente se supone 


que reflejaba una variable latente relevante. Después, aplicaron sus 
descubrimientos para estudiar una serie de posibles medidas del procesamiento 
ejecutivo. Entre ellas se incluía el rendimiento en la doble tarea, el Test de 
Clasificación de Tarjetas de Wisconsin, la Torre de Hanoi, la producción 
aleatoria y la amplitud de operaciones de Turner y Engle. 


Entre los posibles procesos ejecutivos subyacentes que podrían explicar el 
rendimiento en estas medidas estándar se incluían los siguientes: la inhibición 
prepotente, tal como se describió previamente, que midieron usando la tarea 
antisacádica, el test de Stroop, y una tarea que requería responder a una señal de 
stop que aparecía ocasionalmente entre una serie de respuestas rápidas muy 
practicadas. La capacidad para actualizar la memoria de trabajo se midió usando 
la clásica tarea en la que los sujetos tienen que recordar el último estado de una 
serie de variables que están en constante cambio (Yntema y Trask, 1963). Otras 
tareas de actualización consistían en registrar cambios en los tonos, y mantener 
las últimas cuatro letras de una cadena continua, recordándolas cuando la cadena 
se interrumpiera impredeciblemente. Un tercer grupo de tres tareas medían la 
capacidad para cambiar de tarea usando las tareas desarrolladas por Jersild 
(1927) y Rodgers y Monsell (1995). Una tarea consistía en alternar entre la 
adición y la sustracción, otra consistía en parejas de letras y números, y requería 
alternar entre el procesamiento de números y de letras, mientras que la tercera 
consistía en distinguir perceptivamente entre un nivel local y uno global. Una 
serie de ítems locales, como por ejemplo dígitos, se colocaban espacialmente 
formando una constelación o un patrón que fuera en sí mismo un dígito. Los 
sujetos tenían que alternar entre una respuesta a nivel local o a nivel global. 


El análisis indicó que efectivamente los distintos subtipos de medidas ejecutivas 
propuestas daban lugar a una serie de factores latentes identificables. Tal como 
se esperaba, cuando estos factores fueron aplicados al estudio de tareas utilizadas 
clínicamente, ninguno demostró ser puro en cuanto al proceso, aunque las tareas 
diferían en la medida en que reflejaban los distintos procesos ejecutivos 
subyacentes propuestos. Por tanto, el Test de clasificación de Tarjetas de 
Wisconsin saturaba de forma particularmente alta en la capacidad para cambiar 
de tarea, lo que fue tranquilizador ya que de hecho el test implicaba alternar de 
una categoría a Otra. La Torre de Hanoi parecía ser particularmente sensible al 
nivel de inhibición, al igual que la producción aleatoria, mientras que la tarea de 
amplitud de operaciones se relacionó más con la capacidad de actualización. El 
rendimiento en la doble tarea no se relacionó con ninguna de estas medidas. Esto 
no significa que no fuera una tarea ejecutiva, sino simplemente que no se ha 


identificado un proceso relevante usando la actual serie de medidas. 


Por tanto, en este punto, el análisis de variable latente parecer ser una técnica 
muy prometedora. Sin embargo, la experiencia con el uso de medidas 
psicométricas en áreas como el envejecimiento, y de hecho en el estudio de la 
inteligencia misma, sugiere cierta precaución en este punto. Sin embargo, si 
estos resultados se demostraran robustos, y otros laboratorios con versiones algo 
distintas de tareas similares produjeran resultados ampliamente comparables, 
entonces desentrañar los complejos hilos que forman el ejecutivo central podría 
ser una tarea mucho más abordable de lo que parecía en un principio. 


11.6. Memoria de trabajo y educación 


Una forma de poner a prueba la robustez de una teoría consiste en llevarla al 
mundo e intentar usarla para abordar problemas prácticos importantes. Susan 
Gathercole y sus colegas llevaron a cabo un extenso programa de investigación 
que comenzaba desarrollando una batería de tests sobre memoria de trabajo 
adaptada para niños de un amplio rango de edades. La batería proporcionaba 
medidas del ejecutivo central y del rendimiento del bucle fonológico y de la 
agenda visoespacial, y fue aplicada por Gathercole y Pickering (2000b) a niños 
con dificultades para el Inglés o las Matemáticas. Encontraron que un 
rendimiento pobre se asociaba con bajas puntuaciones en las medidas del 
ejecutivo central, y en menor grado con las medidas del bucle fonológico. Un 
patrón similar se encontró al estudiar otro grupo de niños con necesidades 
educativas especiales (Gathercole y Pickering, 2001). 


En un estudio correlacional posterior se relacionó el rendimiento obtenido con su 
batería con la puntuación obtenida en las pruebas nacionales estándar, con el 
rendimiento en su batería de MT usando una muestra más grande de niños de 
siete a ocho años. A la edad de siete años, el rendimiento en Matemáticas o en 
Inglés estaba asociado con la puntuación en memoria de trabajo, siendo 
particularmente sensibles las pruebas de amplitud compleja. Otra muestra de 
sujetos de 14 años mostró una asociación similar entre la puntuación en MT y las 
Matemáticas y las Ciencias, pero no para el caso del Inglés. Concluyeron que, 
mientras que a la edad de siete años los tests de inglés se basan principalmente 


en conocimientos básicos de lectura y escritura, a la edad de 14 años se espera 
que el niño responda narrativamente a las preguntas relacionadas con los libros y 
los juegos que haya estudiado. Esto nos recuerda que, a pesar de la importancia 
de la memoria de trabajo, el rendimiento escolar también depende de otros 
muchos factores. 


11.6.1. Una batería de memoria de trabajo automatizada, la EAMT* 


Aunque la batería de tests inicial triunfó claramente en sus objetivos más 
amplios, a Gathercole et al. les preocupaba que su selección de tareas tendiera a 
acentuar el procesamiento verbal y hubieran dado un peso indebido a las tareas 
complejas de memoria de trabajo visual. El test era también algo largo, y 
requería un examinador entrenado. Intentaron remediar estos dos inconvenientes 
desarrollando una versión del test automatizada, junto con una ligera 
modificación de las tareas que lo componían. La Evaluación Automatizada de la 
Memoria de Trabajo (EAMT) consistía en tres pruebas de MCP verbal, tres de 
MCP visoespacial, tres de amplitud verbal compleja y tres que medían amplitud 
visoespacial compleja (Alloway et al. , en prensa). 


La batería se administró a 709 niños con edades entre los cuatro y los once años, 
y los resultados se analizaron usando modelos de ecuaciones estructurales, 
intentando ajustar los datos a modelos de dos, tres o cuatro componentes. 
Encontraron que el modelo de tres componentes era el que mejor se ajustaba a 
los datos, con agrupaciones que eran compatibles con la división de la memoria 
de trabajo en un ejecutivo central y en sistemas de MCP verbal y visoespacial 
asociados (ver Fig. 11.2). Los tres factores estaban, sin embargo, muy 
correlacionados entre sí, y la unión entre el ejecutivo central y el procesamiento 
visoespacial fue la más fuerte, un patrón que no habíamos detectado antes. Esta 
unión visoespacial se acentuaba en los más pequeños, en niños de cuatro a seis 
años, equilibrándose a medida que los niños se hacían mayores. 


11.6.2. Niños con déficits específicos 


Gathercole y sus colegas siguieron estudiando subgrupos de niños con patrones 
de déficits cognitivos específicos. Archibald y Gathercole (2006) estudiaron un 
grupo de niños con Deterioro Específico del Lenguaje (SLI), un patrón de déficit 
que ciertamente incluía al lenguaje, pero que a menudo es menos específico de 
lo que su nombre indica. Encontraron que el grupo de niños con SLI tenían 
dificultades en cuanto a la amplitud de memoria verbal compleja y en repetición 
de no-palabras, lo que implicaba un déficit tanto en el bucle fonológico como en 
el ejecutivo central, sin embargo, su MCP visoespacial y su memoria de trabajo 
estaban comparativamente desocupadas (Archibald y Gathercole, 2006). En un 
estudio posterior se examinó el rendimiento de 14 niños diagnosticados con un 
SLI y a otros 14 niños control equivalentes usando la batería desarrollada por 
Bayliss et al. (2003) para separar el almacenamiento del procesamiento tanto de 
material visoespacial como verbal. Encontraron que el grupo con SLI fue 
significativamente más lento tanto en el procesamiento visoespacial como en el 
verbal, pero la exactitud solo se vio deteriorada significativamente en las tareas 
de memoria de trabajo complejas que implican almacenamiento verbal, 
independientemente de que se combinara con el procesamiento verbal o 
visoespacial. Una vez más, esto sugería un déficit combinado del ejecutivo 
central y del bucle fonológico. 
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Fig. 11.2. El modelo de tres componentes que mejor se ajusta al rendimiento en 
la batería de Evaluación Automatizada de la Memoria de Trabajo. Datos de 
Alloway et al. (2006). En: «Memoria a corto plazo verbal y visoespacial y 
memoria de trabajo en niños: ¿son independientes?», Child Development, 77, 
1698-1716. 


Parece por tanto que un deterioro relativamente puro del bucle fonológico no 
tiene en sí mismo un efecto a largo plazo importante sobre el desarrollo 
intelectual, pero produce un deterioro relativamente sutil en la adquisición de 
nuevos nombres o de nuevas formas fonológicas. Este resultado posee claras 
implicaciones para la naturaleza de la unión entre el bucle fonológico y la 
adquisición de vocabulario que se discutió en el Capítulo 2. Mientras que un 
deterioro puro del bucle fonológico impediría el desarrollo del lenguaje, lo que 
es particularmente dañino es la combinación de esto con una capacidad ejecutiva 
débil. Incluso en niños con habilidades ejecutivas pobres, el papel del bucle 
fonológico disminuye a medida que se desarrolla el vocabulario. Esto se observó 
claramente en un estudio de Jarrold et al. (2004) sobre el desarrollo del lenguaje 
en niños con trastornos de aprendizaje. Encontramos un vínculo entre las 
medidas basadas en el bucle fonológico y la adquisición del lenguaje, el cual 
desapareció en años posteriores, presumiblemente como resultado de otros 
factores cada vez más dominantes, como la inteligencia general y el grado de 
exposición al lenguaje. 


11.6.3. Memoria de trabajo en el aula 


En este punto debería haber quedado claro que existen muchas versiones 
distintas de las tareas de amplitud de memoria complejas que son capaces de 
predecir adecuadamente el rendimiento cognitivo diario. Aunque esto es 
gratificante, me defraudaría que el concepto de memoria de trabajo produjera 
simplemente un nuevo conjunto de tests de inteligencia. De hecho, el trabajo de 
Gathercole sugiere que los niños pueden tener una memoria de trabajo pobre sin 
tener una baja inteligencia. Ella y sus colegas decidieron llevar a cabo un estudio 


de observación en el aula para ver si podían describir la naturaleza de los 
problemas a los que se enfrentan estos niños. 


Rápidamente se observó con claridad que existían muchos problemas como estos 
(Gathercole et al. , 2006). Los niños con amplitud de MT baja tienen dificultades 
para seguir instrucciones. Esto no es sorprendente para algunas de las 
instrucciones que se observaron, como: «Poned vuestras hojas sobre la mesa 
verde, poned vuestras tarjetas en el paquete, guardad vuestros lápices, venid y 
sentaos en la alfombra.» Los problemas se daban incluso con instrucciones más 
cortas. A un niño, Nathan, le facilitaron su tarjeta para entrar en el ordenador, y 
le ordenaron que trabajara en el ordenador 13. No pudo obedecer la orden, ya 
que inmediatamente había olvidado qué ordenador tenía que usar. 


Otras situaciones parecidas se dieron cuando el niño tenía que procesar y 
almacenar simultáneamente, por ejemplo, al generar una frase, recordando cómo 
se deletreaban las palabras y al mismo tiempo escribiendo la frase sin olvidarla. 
Desafortunadamente, las ayudas para mejorar el rendimiento académico, como 
el uso de filas de números en aritmética, a menudo requieren un procesamiento 
simultáneo y son particularmente difíciles de usar para estos niños. 


Gathercole y sus colegas se han basado en estas observaciones iniciales para 
desarrollar métodos que permitan a los profesores identificar a estos niños, 
descritos típicamente por los profesores como niños desatentos o poco 
motivados. No les identifican como niños con problemas de memoria, aunque 
ellos mismos se quejen de que olvidan lo que tienen que hacer. Sin embargo, los 
profesores parecen ser receptivos a la idea de un déficit en la memoria de 
trabajo, y están interesados en saber cómo detectar y ayudar a estos niños. 
Actualmente, se están desarrollando cuadernillos para profesores y están siendo 
utilizados en un estudio de intervención para probar su efectividad a la hora de 
enseñar a los profesores a identificar y ayudar a los niños con problemas en la 
memoria de trabajo. 


11.7. Conclusión 


En conclusión, el estudio de las diferencias individuales en memoria de trabajo 
avanza ahora más allá de sus primeras fases, demostrando el poder predictivo de 


las medidas de amplitud de memoria de trabajo complejas. Como resultado, el 
concepto básico de memoria de trabajo se ha usado para desarrollar medidas que 
han demostrado ser aplicables al análisis de una serie de problemas educativos y 
que están empezando a sugerir posibles soluciones. 


Notas al pie 


* En inglés AWMA, que se corresponde con «Automated Working Memory 
Assessment». N. de la T. 


CAPÍTULO 12 


Neuroimagen en la memoria de trabajo 


A lo largo de una vida relativamente corta, la psicología cognitiva ha ido 
generando nuevas ideas de tanto en tanto, métodos o técnicas que a su llegada 
parecía que iban a transformar el campo. Algunas lo lograron, como en el caso 
de la metáfora del procesamiento de la información, basada en el ordenador, 
mientras que otras como la gramática transformacional en la psicolingúística, los 
modelos matemáticos en el campo de la memoria o la teoría de la detección de 
señales en percepción han sido absorbidas como parte de la práctica estándar: 
métodos que son útiles sin necesidad de un cambio dramático en el paisaje 
teórico subyacente. En el campo de la memoria humana, no hay duda de que la 
neuroimagen es la técnica que genera mayor entusiasmo en la actualidad. Es 
más, el estudio de la memoria de trabajo parece contribuir de forma 
particularmente fuerte en su desarrollo. A lo largo del presente libro se usan 
datos procedentes de imágenes, junto con otras pruebas particularmente 
relevantes para los temas que se discuten. Este enfoque es suficientemente 
importante para los actuales progresos en la memoria de trabajo como para 
merecer un capítulo aparte, que no pretende revisar en detalle la enorme cantidad 
de hallazgos experimentales, sino más bien concentrarse en una serie de temas 
concretos sobre los que se han acumulado suficientes datos como para permitir 
hacer ciertas valoraciones acerca de los puntos fuertes y débiles de este enfoque. 


Esta no es un área en la que me haya involucrado especialmente, aunque sí he 
colaborado en algunos estudios de neuroimagen. Por suerte, están empezando a 
surgir una serie de artículos que intentan arrojar conclusiones amplias y 
coherentes acerca de los complejos y diversos patrones de datos generados por 
los estudios con imágenes sobre la memoria de trabajo (ver Owen, 1997; Smith y 
Jonides, 1997; Henson, 2001). Empezaré describiendo brevemente los 
principales métodos de neuroimagen que han sido usados hasta el momento para 
estudiar la memoria de trabajo, para beneficio de los lectores no familiarizados 
con este campo en rápida expansión. 


12.1. Tomografía de emisión de positrones (T'EP) 


Este es el método que inicialmente ocasionó mayor entusiasmo sobre las 
imágenes. El método consiste en usar un ciclotrón para producir agua radioactiva 
o glucosa que luego se le inyecta al sujeto. Esta es transportada por la sangre, y 
luego puede ser detectada como radiación gamma, a través de una serie de 
detectores que se usan para localizar los puntos de máxima actividad. Estos 
puntos se corresponden con los puntos en los que la sangre viaja con mayor 
fluidez. Cuando una zona concreta del cerebro está siendo muy usada, se supone 
que absorbe y emite más radiación que cuando está relajada. Por tanto, un 
estímulo visual, por ejemplo, originará una mayor emisión en el área crucial para 
las primeras fases de la visión (ver Frith y Friston [1997] para una revisión). 


El cerebro está, por supuesto, en constante actividad. Por esta razón, si uno 
quiere identificar la actividad resultante de un proceso cognitivo determinado, 
como el almacenamiento memorístico, es necesario comparar una condición que 
implique almacenamiento con otra en la que el resto de los factores se mantenga 
constante, pero en la que no haya almacenamiento, empleando la citada técnica 
de la sustracción. Por supuesto, esta es la lógica que subyace al uso de la 
metodología de la doble tarea en los estudios sobre la memoria de trabajo 
puramente conductuales, en los que, por ejemplo, se compara una condición 
control de memoria a corto plazo y la misma tarea realizada bajo supresión 
articulatoria, en donde la diferencia refleja la contribución del repaso subvocal. 
El hecho de que el método funcione en un contexto conductual sugiere que 
podría ser un buen candidato para el uso de imágenes, tal como sucedió, como 
ahora veremos. 


Aunque la mayoría de los estudios de TEP que describiremos consisten en medir 
la fluidez de la sangre, es posible estudiar la distribución y actividad de una serie 
de importantes neurotransmisores mediante una selección de moléculas que se 
ligan al lugar del receptor relevante para ese neurotransmisor específico, y es 
posible etiquetarlas radioactivamente. A su debido momento, sospecho que este 
acercamiento al papel y a las operaciones de los neurotransmisores será 
enormemente fructífero para el estudio de procesos que han demostrado ser muy 
complejos de tratar usando las habituales técnicas experimentales y 


neuropsicológicas. Sin embargo, el área sigue estando en una fase de desarrollo 
muy temprana, y de momento no ha contribuido demasiado a nuestra 
comprensión de la memoria de trabajo. 


Los estudios de TEP basados en la fluidez de la sangre han sido muy efectivos 
identificando grandes áreas de actividad sostenida, pero debido al tiempo que 
necesita el material radioactivo para ser transportado, absorbido y detectado, este 
método no es adecuado para identificar procesos que cambien rápidamente. 
También es muy caro, ya que la vida media de los nucleótidos empleados es 
corta, obligando a los laboratorios a tener allí un equipamiento completo del 
ciclotrón. Además, la cantidad de radioactividad a la que se puede exponer un 
individuo está obviamente limitada. Esto no solo nos impide repetir un examen 
experimental a un mismo sujeto, sino que también supone un problema para los 
estudios seriales acerca del desarrollo o progresión de una enfermedad. Con el 
TEP también se necesita supervisión médica, además de un apoyo fisicoquímico, 
de ingeniería y estadístico, lo que la convierte en una herramienta muy cara. 


12.2. Resonancia magnética funcional (f£MRI) 


Este método se centra en el hecho de que cuando el cerebro se sitúa en un campo 
magnético, distintos núcleos atómicos se alinean en orientaciones diferentes. 
Esto permite identificar áreas usadas por el cerebro cuando se lleva a cabo una 
actividad dada, proporcionándonos una medida de la actividad de cualquier 
región del cerebro. La identificación de las áreas depende de las diferencias en 
los niveles de oxígeno del cerebro (respuesta en NEGRITA) entre las distintas 
tareas. Este método tiene la ventaja de que no necesita radioactividad. Es más, es 
capaz de detectar los cambios que se producen en tiempo real. El grado de 
resolución espacial depende de la fuerza del imán, en los primeros estudios los 
imanes tenían una fuerza de 1.5 teslas, aunque en la actualidad se están usando 
imanes con una fuerza superior a las 7 teslas. Aunque estos imanes son caros, el 
empleo de este sistema en su conjunto es menos caro que el TEP, y dada su 
resolución temporal y espacial está empezando a usarse cada vez más en 
estudios sobre la función cognitiva. Además, su aparente seguridad significa que 
la FMRI se puede usar repetidamente con el mismo sujeto. 


Sin embargo, el método tiene también ciertas restricciones. La presencia de 
fuertes imanes limita sustancialmente el tipo de equipamiento que se puede usar 
en sus proximidades. La técnica consiste en tomar imágenes de «capas» del 
cerebro, y a su vez implica cambiar el campo magnético, un procedimiento 
extremadamente ruidoso que suena como si estuvieras en un tubo de hierro que 
fuera golpeado de vez en cuando con un martillo. Finalmente, el uso de 
respuestas orales es problemático, ya que el habla causa un movimiento que 
interfiere con la resolución de la imagen. A pesar de estos problemas técnicos, el 
campo está avanzando rápidamente, acogiendo particularmente bien la obtención 
de imágenes ligadas a un suceso a través de las cuales el escaneo podría unirse a 
las fases concretas de un procedimiento experimental. Esto nos permite tomar 
imágenes separadas de factores como la codificación, el almacenamiento y la 
recuperación. 


12.3. Electroencefalografía (EEG) 


Este método implica registrar la actividad eléctrica del cerebro a través de unos 
electrodos situados en el cuero cabelludo, y es el más viejo de los tres métodos 
descritos. Durante muchos años se ha usado su clínica para identificar 
anormalidades epilépticas, por ejemplo, mediante una serie de electrodos usados 
para identificar el foco epiléptico. Se refinó usando la técnica de Potenciales 
Evocados (PE), por la que el procesamiento de un solo estímulo como un clic se 
puede seguir gracias a la forma de la curva electrofisiológica que produce (ver 
Kutas y Dale [1997] para una revisión). Durante muchos años esto pareció 
representar un área de la psicología cognitiva sofisticada pero algo estancada y 
secreta. Esto ha cambiado dramáticamente en los últimos años, y sus métodos se 
han usado con gran éxito en el estudio de la atención (ver Posner y Petersen 
[1990] para una revisión), y de la memoria (ver Rugg [1995] para una revisión). 
Este método tiene la ventaja de que permite una precisión temporal considerable, 
aunque su resolución espacial está inevitablemente limitada por la necesidad de 
captar señales que hayan pasado a través del cráneo, y que son la suma total de 
muchos procesos distintos. Este método se ha usado mucho menos en el estudio 
de la memoria de trabajo que los métodos TEP y fMRI, pero parece probable que 
en el futuro juegue un papel cada vez mayor, ya que es considerablemente menos 
caro que los otros métodos, y no es nada invasivo. 


12.4. Otras técnicas 


El reto de observar la actividad del cerebro vivo sigue atrayendo una gran 
atención técnica. Hay, por ejemplo, procedimientos como la EGM, en la que se 
detecta la actividad magnética del cerebro, aunque requiere un equipamiento que 
solo ahora comienza a estar ampliamente disponible. En el momento en que 
escribí esta revisión, tenía escaso impacto sobre el estudio de la memoria de 
trabajo. Estoy seguro de que esto cambiará, ya que la EMG ofrece un método no 
invasivo más directo que permite una resolución temporal concreta, que puede 
combinarse usualmente con la fMRI. 


Otro método que probablemente crezca en importancia es la tractografía, por la 
que se usan las IRM (Imágenes por resonancia magnética)* para seguir el rastro 
mielinizado que deja la materia blanca del cerebro. Esto forma una red de 
uniones entre áreas del cerebro descritas por los neuroanatomistas del siglo 
diecinueve pero que han estado enormemente ignoradas. Los trabajos recientes 
han reactivado el interés en lo que podrían ser sistemas que permiten que áreas 
del cerebro que no están anatómicamente cerca puedan comunicarse entre sí con 
rapidez y eficiencia, de la misma forma que las principales autopistas facilitan el 
tránsito entre ciudades. La Fig. 12.1 muestra un ejemplo de un sistema de vías de 
materia blanca que podríamos suponer que esté incluido en el funcionamiento 
del bucle fonológico. En este momento, la tractografía se limita a la producción 
de imágenes estructurales, pero creo que sería posible desarrollar una 
tractografía funcional en un futuro cercano. 
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Fig. 12.1. La figura superior representa una reconstrucción del tracto arqueado 
que conecta los centros de Broca y de Wernicke (datos de Catani et al. , 2004). 
El panel inferior representa una posible localización del modelo del bucle 
fonológico (Catani et al. , 2005, modificado). En: «Redes perisilvianas del 
lenguaje en el cerebro humano», Anales de Neurología, 57, 8-16. Reproducido 
con el permiso de John Wiley €: Sons, Inc. Por favor, ver la Ilustración 1 para 
una versión en color de esta figura. 


Finalmente, debemos mencionar los métodos que interfieren con la actividad de 
áreas específicas del cerebro. Una de estas técnicas es la estimulación magnética, 
por la que un fuerte campo magnético interrumpe temporalmente el 
procesamiento en el área de la corteza dentro de ese campo. En mi caso, deseché 
la idea de usar esta técnica para el estudio del bucle fonológico al descubrir que 
cuando se aplicaba a la inevitable área de interferencia con el repaso, ¡era la 
responsable de causar dolor de muelas en el desafortunado sujeto! Es probable 
que estos problemas se resuelvan, proporcionando una herramienta útil para 
focalizar temporalmente «lesiones reversibles» en áreas específicas del cerebro, 
aunque tiene el inconveniente de que solo se puede aplicar en áreas corticales 
superficiales. 


Un método muy establecido, aunque en comparación raramente empleado, 
implica la estimulación por parte de un cirujano del cerebro de un paciente 
consciente durante una intervención. El cerebro no tiene receptores del dolor, y 
el método es útil para comprobar durante la cirugía qué función posee una zona 
concreta del cerebro como atenuante de la epilepsia, un procedimiento 
quirúrgico que puede ser muy útil, siempre que se pueda asegurar que el área del 
cerebro que se anula no es crucial para el funcionamiento cognitivo del paciente 
u otro funcionamiento. Penfield (1958) describió la evocación de lo que él 
mismo sugirió controvertidamente como memorias autobiográficas, mientras que 
Ojemann (1978; 1994) empleó el método para explorar regiones implicadas en el 
lenguaje y en la memoria a corto plazo. 


12.5. Denominando las partes 


Lo que sigue a continuación es en su mayoría la asociación entre funciones 
cognitivas concretas y regiones específicas del cerebro. Estas se pueden 
identificar de distintas maneras. Una forma se refiere a la actividad de un área 
general del cerebro, como el lóbulo temporal u occipital. Por supuesto, es 
necesario especificar si la actividad se da en la zona izquierda o derecha del 
cerebro, o si es bilateral. Como estas áreas son relativamente grandes, es normal 
especificar además si se localiza en el área anterior (frontal) o posterior (trasera) 
del lóbulo, o quizá en los alrededores de la unión de los dos lóbulos, como en el 
caso de la localización temporoparietal del componente de almacenamiento del 
bucle fonológico, que tiende a solapar los lóbulos temporal y parietal. Para 
complicarlo todo aún más, es posible usar como marcas identificativas otros 
rasgos del cerebro, como por ejemplo la fisura de Silvio que separa el lóbulo 
temporal de las áreas parietal y frontal. Por tanto, al área del almacenamiento 
fonológico podría referirse, y algunas veces lo hacemos, como área peri-Sílvica, 
alrededor del área de la fisura de Silvio. Brodman (1909) proporcionó una 
descripción de la localización potencialmente más precisa, basándose en la 
citoestructura que subyace al cerebro y en la estructura celular, asignando un 
número a cada área. La consecuencia es que las diferencias celulares que se dan 
en las distintas regiones del cerebro repercuten en la función realizada por estas 
áreas diferentes del cerebro, aunque hasta donde yo sé, aún no está muy claro 
cómo se relaciona la estructura celular con la función cognitiva. 


Un ejemplo de estas diversas posibilidades terminológicas es el área responsable 
del repaso subvocal, a la que podemos referirnos como área prefrontal izquierda, 
Área de Broca, o Área 44 de Brodman (BA 44, abreviadamente), mientras que el 
área responsable del almacenamiento fonológico se puede describir como peri- 
Sílvica, en la confluencia de los lóbulos parietal/temporal, o como BA 40. En 
todos estos casos, la referencia es del hemisferio izquierdo. Solo para complicar 
algo más el tema, la actividad del bucle fonológico puede originar a veces la 
activación de áreas análogas del hemisferio derecho, aunque típicamente no de 
forma tan extensa (Awh et al. , 1996). Esta actividad del hemisferio derecho 
tiende a darse bajo condiciones de sobrecarga, sugiriendo que podría representar 
un simple desborde de la actividad, o bien posiblemente la necesidad de recurrir 
a Otros procesos para soportar la sobrecarga. Otras complicaciones aparecen por 
el hecho de que una actividad dada no solo aparece exclusivamente en una única 
área de Brodman, sino que suelen solaparse. Por ello, el área de Broca y el 
control del repaso a menudo se solaparán con el área 6, y nos referiremos a ella 


como activación del área 44/6. 


12.6. ¿Qué hemos aprendido a partir de las imágenes de la memoria de 
trabajo? 


Como persona ajena al campo de las imágenes, ¿cómo se valoran los trabajos 
existentes? En mi caso, yo comienzo intentando comprender la cuestión lanzada 
en un estudio determinado, y después deseo encontrar una respuesta 
razonablemente simple y coherente. Por supuesto, el patrón de actividad a lo 
largo del cerebro es extremadamente complejo, de forma parecida a una cadena 
montañosa en la que solo se identifican los picos más importantes y 
posiblemente los valles. En el caso de la TEP, los picos son el promedio de los 
procesos que se extienden durante algunos segundos, y que posiblemente 
cambian dramáticamente en ese tiempo. Lo que constituye un pico depende, por 
supuesto, del análisis estadístico de una cantidad enorme de datos, usando 
métodos que probablemente sean mucho menos familiares que los 
procedimientos analíticos estándar usados en los artículos experimentales 
habituales. Cambiando los umbrales de detección estadística, los picos pueden 
aparecer o desaparecer. Es más, en muchos estudios de fMRI, los resultados se 
presentan en forma binaria, como si una parte del cerebro estuviera activa O 
inactiva. Además, los estudios de imágenes son caros, y, particularmente en los 
primeros artículos, contenían relativamente pocos sujetos, y se empleaban 
distintos escaneados con un mismo sujeto, tratándolo como si fueran sucesos 
independientes, de una forma que no se hubiera aceptado en un estudio cognitivo 
experimental estándar. Poco a poco iremos desgranando estos problemas, pero 
seguimos teniendo dificultades para evaluar y comparar datos procedentes de 
estudios y laboratorios diferentes. 


12.6.1. Imágenes de los subsistemas de la memoria de trabajo 


¿Qué esperaría ver? En primer lugar, como inexperto que soy, sería una ventaja 
si los resultados fueran lo suficientemente simples y coherentes como para 


comprenderlos sin un extenso entrenamiento adicional. En segundo lugar, 
desearía que estos resultados se replicaran dentro de un mismo laboratorio así 
como entre laboratorios distintos. En tercer lugar, sería tranquilizador si los 
resultados se ajustaran plausiblemente a nuestro conocimiento existente a partir 
de los estudios con sujetos normales y con pacientes neuropsicológicos, y en el 
caso de estudios neuropsicológicos, si las áreas de activación observadas fueran 
ampliamente consistentes con la evidencia basada en datos previos de lesiones 
anatómicas. Si los estudios que emplean imágenes de la memoria de trabajo 
alcanzaran estos criterios fácilmente, la cuestión que surge entonces es si las 
imágenes pueden decirnos algo sobre la memoria de trabajo que aún no 
sepamos. Soy optimista respecto a todos estos puntos, pero el tema sigue sin 
estar muy claro. 


El estudio de la memoria de trabajo ha ganado mucho en popularidad y, 
justificadamente o no, también en credibilidad, gracias a estudios que han 
intentado usar el modelo multicomponente como base de las investigaciones que 
usan la neuroimagen. En uno de los primeros estudios importantes con TEP 
acerca del bucle fonológico, Paulesu et al. (1993) contrastaron la actividad 
producida por una tarea que incluía la memoria para letras con una segunda tarea 
en la que los sujetos realizaban juicios sobre rimas, lo cual sabemos que depende 
del habla subvocal. Identificaron un área, la frontera entre el lóbulo izquierdo 
parietal y el lóbulo temporal que parecía estar asociada con el almacenamiento 
memorístico, el área de Brodman (BA) 40, y una segunda área en la región 
frontal izquierda que parecía estar unida al repaso subvocal, BA 44. La primera 
de estas áreas coincidía con la localización del daño típicamente asociado a 
pacientes con un déficit muy específico en la MCP fonológica (Vallar y Shallice, 
1990), mientras que la activación frontal coincidía con el Área de Broca, 
asociada clásicamente con la capacidad para el habla. 


Casi al mismo tiempo que el estudio de Paulesu et al., se publicó un experimento 
equivalente de Jonides et al. (1993) con imágenes sobre la memoria a corto plazo 
visoespacial. También usaron la técnica de la sustracción, pidiendo a sus sujetos 
que recordaran la localización de tres puntos. Tras una demora de tres segundos, 
aparecía un círculo en la pantalla, y se pedía al sujeto que dijera si coincidía o no 
con uno de los puntos. Esta condición se puso en comparación con otra en la que 
los círculos y los puntos aparecían simultáneamente, eliminando por tanto la 
necesidad de recuerdo. En contraste con el estudio fonológico de Paulesu et al., 
encontraron que la activación se daba principalmente en el hemisferio derecho, 
concretamente en el área temporoparietal derecha (BA 6) y en la región 


prefrontal inferior (BA 47). Réplicas posteriores han confirmado este patrón de 
actividad, con alguna indicación de bilateralidad, y la sugerencia de que podrían 
estar involucradas dos áreas parietales (BA 40 y 7). Smith y Jonides (1997) 
revisan esta literatura. 


Aunque Paulesu et al. fueron los primeros en tomar imágenes del bucle 
fonológico, la investigación más grande sobre memoria de trabajo usando la 
neuroimagen fue llevada a cabo por Edward Smith y por Jon Jonides en la 
Universidad de Michigan. Un trabajo sistemático, cuidadoso y bien diseñado 
sigue siendo extraño en la neuroimagen, donde la novedad de la técnica ha 
originado a menudo una especie de «fiebre del oro», en la que los grupos 
apuestan por un fenómeno y por un área, justo antes de seguir con la búsqueda 
de otro fenómeno por el que apostar. Como consecuencia hay una serie de 
efectos aparentemente importantes y excitantes que no han sido replicados por 
otros grupos, o si lo han hecho, han dado con resultados algo distintos, que 
pueden atribuirse o no a las diferencias entre los procedimientos. Por esta razón 
me concentraré inicialmente en una serie relativamente pequeña de estudios 
sobre la memoria de trabajo, principalmente del grupo de Michigan, antes de 
discutir la cuestión de la consistencia entre paradigmas y laboratorios. 


12.6.2. Distinguiendo la memoria de trabajo verbal y visual 


Smith et al. (1996) llevaron a cabo la primera comparación directa entre la 
memoria de trabajo verbal y visoespacial dentro del mismo estudio. Se mostraba 
a los sujetos cuatro letras, o bien una serie de tres puntos. A continuación, tras 
una demora se mostraba un ítem de prueba, que podía ser una letra o un círculo. 
Si era una letra, se pedía que recordara si esta había aparecido anteriormente, y si 
era un círculo, si este coincidía espacialmente con la localización de uno de los 
puntos. En ambos casos, la condición control consistía en presentar el estímulo y 
el ítem de prueba simultáneamente, eliminando por tanto la necesidad de 
recordarlo. Los resultados se muestran en la Fig. 12.2. Como en caso de Paulesu 
et al. (1993), ellos observaron una activación en el hemisferio izquierdo para la 
tarea verbal, Áreas de Brodman 40 y 44. De forma consistente con su propio 
trabajo previo, la tarea del punto activaba principalmente el hemisferio derecho, 
y en particular las áreas 40 y 6. 


En un segundo experimento se presentaron las cuatro letras en lugares 
específicos, posteriormente se puso a prueba el recuerdo del nombre de la letra, 
o de su posición. De nuevo, el recuerdo del nombre de la letra activó 
predominantemente el hemisferio izquierdo y el recuerdo de la localización 
activó el derecho principalmente. Su tercer experimento incluía un 
procedimiento sobre amplitud memorística con un funcionamiento más activo, 
conocido como la técnica N-back, en la que el sujeto observa una cadena de 
letras, y en el caso de Smith et al., el sujeto tiene que responder cuando una letra 
dada se corresponda con la letra presentada dos posiciones más atrás en la 
secuencia. Por supuesto, esto requiere que el sujeto esté continuamente 
actualizando, almacenando y descartando ítems, lo que supone una manipulación 
considerablemente mayor y una carga ejecutiva mayor que la que típicamente 
requiere la tarea de amplitud de memoria normal. El nivel de carga ejecutiva 
puede variar, desde comparar con la última letra presentada, lo que simplemente 
requiere detectar repeticiones, hasta comparar con tres o incluso cuatro letras 
más atrás, lo que requiere que el sujeto mantenga y manipule simultáneamente 
cuatro letras diferentes. Smith et al. encontraron que esta tarea activaba la misma 
región del hemisferio izquierdo que la simple tarea de las cuatro letras de prueba, 
sugiriendo que esta tarea se lleva a cabo usando el bucle fonológico. Sin 
embargo, también se encontró una activación frontal, que presumiblemente 
reflejaba la carga ejecutiva adicional. Esta tarea es particularmente conveniente 
para los estudios de fMRI, ya que se trata de una tarea verbal en la que cuando se 
detecta una repetición se puede señalar simplemente presionando un botón, y no 
requiere una respuesta verbal en alto, que tiene la desventaja de que provoca la 
vibración de la cabeza e interfiere con el escáner. 


En un estudio con TEP de Awh et al. (1996) se usó una tarea de recuerdo verbal 
de letras, hallando de nuevo la activación de las áreas 44 y 6 del hemisferio 
izquierdo, con una mayor activación en la frontera de las áreas 40 y 7, en el 
cíngulo anterior y en el cerebelo derecho, que se une con el hemisferio 
izquierdo. La repetición de la tarea de memoria verbal dos-back también activó 
las áreas 40, 7, 44 y 6 en el hemisferio izquierdo, esta vez mostrando también 
cierta activación del cerebelo izquierdo y del Área Motora Suplementaria 
(AMS). En esta ocasión se detectó algo más de actividad en el hemisferio 
derecho en el área 6 y 7 y en el AMS, y una vez más se vio involucrado el 
cerebelo derecho y el cíngulo anterior. Un tercer experimento intentó usar el 
método de la sustracción para aislar el componente de repaso. A diferencia de 
Paulesu et al., quienes infirieron el repaso a partir de una tarea de juicios sobre 
rimas, Awhy et al. usaron la repetición subvocal de una secuencia de recuento 


sobreaprendida. Restando este patrón de activación del patrón resultante de la 
tarea de memoria, se obtuvo que las áreas 40, 7 y AMS del hemisferio izquierdo 
estaban todas involucradas en el componente memorístico, junto con una cierta 
actividad en el hemisferio derecho en las áreas BA 7 y en el AMS, y la habitual 
actividad cerebélica del hemisferio derecho. 


Todos los estudios con imágenes sobre la memoria de trabajo visual y verbal 
descritos hasta el momento han usado la presentación visual. Sin embargo, en el 
caso de los subsistemas de memoria de trabajo, está claro que estos no dependen 
de la modalidad de presentación. Por ello, los efectos de similitud fonológica 
aparecen con presentación tanto visual como auditiva, al igual que los efectos 
sobre imágenes visoespaciales (Baddeley, 1986). En otra réplica de sus primeros 
hallazgos, Schumacher et al. (1996) presentaron letras, bien visualmente, o bien 
auditivamente. Al igual que en los estudios previos se activaron las mismas 
áreas, independientemente de la modalidad de entrada. Finalmente, en una 
ampliación del estudio de la técnica N-back, Cohen et al. (1997) variaron la 
carga ejecutiva desde cero posiciones atrás, en la que los sujetos simplemente 
detectaban una letra especificada de antemano, hasta tres posiciones atrás. De 
nuevo, el área BA 44 se activó altamente, sugiriendo un uso del repaso subvocal, 
al ser la región de la zona temporoparietal (BA 40) que tiende a asociarse con el 
almacenamiento fonológico, tal como se comprobó mediante el escáner y 
mediante los estudios de lesiones. Ambas áreas del cerebro mostraron cierto 
efecto como consecuencia de la carga de almacenamiento, pero el efecto fue 
particularmente claro en el área BA 40, la región típicamente asociada con el 
almacenamiento fonológico. 


La consistencia de esta serie de estudios es impresionante. Sin embargo, hay que 
mencionar que en al menos dos estudios no se replicó el mismo papel para el 
área 40. En uno de ellos, un estudio de Grasby et al. (1993), se podría achacar a 
que emplearon un diseño menos sensible en el que se hicieron comparaciones 
entre distintos sujetos y no entre distintas condiciones dentro de un mismo 
sujeto. Sin embargo, no fue así en el estudio de Fiez et al. (1996). Pidieron a sus 
sujetos que recordaran, o bien cinco palabras que estaban semánticamente 
relacionadas, o cinco palabras no relacionadas, o bien cinco no-palabras. 
Encontraron un patrón de activación muy diferente del patrón encontrado por el 
grupo de Michigan, con una mayor activación dorsolateral del córtex prefrontal, 
el córtex motor superior, y el cerebelo izquierdo en lugar del derecho. No 
encontraron un incremento significativo de la actividad dentro del lóbulo parietal 
izquierdo, ni en el área de Broca ni en el cerebelo derecho, áreas que sí se 


activaron en los estudios de Smith y Jonides. 


Jonides et al. (1998) sugieren que la diferencia proviene del material empleado 
por Feiz et al., el cual consiste en sus dos terceras partes en palabras con un 
significado semántico, las cuales probablemente animen a usar estrategias que 
son muy diferentes de las estrategias disponibles en el recuerdo de letras o 
dígitos. En el siguiente estudio de Jonides et al. se dificultó el uso de una 
codificación semántica, dando lugar a un patrón de resultados que fue mucho 
más cercano a su anterior trabajo que al de Feiz et al. Sin embargo, una 
diferencia interesante fue encontrar una activación algo más fuerte en el área 40 
en el hemisferio derecho en lugar de en el izquierdo, sugiriendo que incluso sus 
no palabras podrían ofrecer opciones de codificación algo distintas a las usadas 
con las letras o los dígitos. 


En conclusión, aunque el trabajo de Feiz no niega, en mi opinión, los hallazgos 
sustanciales y bien replicados de Paulesu et al. y del grupo de Jonides y Smith, 
ellos se ocupan de la cuestión de las réplicas entre laboratorios. Volveremos a 
este tema. A su vez esto suscita la importancia crucial de la estrategia que adopta 
el sujeto, un tema que también es, por supuesto, crucial en estudios más 
conductuales sobre la memoria de trabajo, donde hay evidencias de que los 
sujetos tienden a abandonar la codificación fonológica cuando los errores se 
vuelven frecuentes (Hall et al. , 1983; Baddeley, 2000; Hanley y Bakopoulou, 
2003). Esto ocurre probablemente con secuencias de cinco no-palabras, o cuando 
la codificación semántica es más fácil, como ocurre en la condición de palabras 
semánticamente relacionadas que usaron Feiz et al. La estrategia que adopta el 
sujeto sigue siendo una variable importante, aunque ignorada, en los estudios 
con imágenes. 


12.6.3. Repaso 


La naturaleza del repaso en la agenda está mucho menos clara que en el bucle 
fonológico. Una posibilidad es que el repaso implique una continua atención a la 
localización del estímulo o posiblemente a la representación del estímulo. Esto 
se puso a prueba en un estudio conductual de Awh et al. (1998). Realizaron un 
experimento de doble tarea en el que el sujeto tenía que recordar la localización 


espacial y, al mismo tiempo, responder ocasionalmente a una tarea de 
discriminación visual. Cuando la tarea coincidía con la misma localización que 
se tenía que recordar, la discriminación fue más rápida, sugiriendo que la 
retención activa, y por tanto el repaso, estaba acompañada de la atención 
sostenida sobre ese estímulo, tal como se predijo. Se obtuvo un mayor apoyo en 
un estudio con FMRI de Awh et al. (1997), en el que se presentó una serie de tres 
puntos situados en el campo visual izquierdo, o bien en el derecho. De vez en 
cuando, se presentaba una cuadrícula bien en un campo visual o bien en el otro, 
y la respuesta evocada quedaba registrada. Cuando la cuadrícula se presentaba 
en el mismo hemisferio que el empleado para recordar la serie de puntos, se 
obtenía una respuesta más fuerte que cuando se presentaba en el otro campo 
visual, sugiriendo de nuevo que recordar una serie espacial implica activar la 
parte del cerebro responsable de esa área visual. La sugerencia de un 
procedimiento de repaso atencional es consistente con el trabajo previo que 
defendía una asociación entre el control atencional visual y el Área 7 de 
Brodman en el córtex parietal derecho (e.g., Corbetta et al. , 1993). Más 
específicamente, Henson (2001) sugiere un posible bucle de repaso que une el 
almacenamiento occipital a través de un vínculo de repaso atencional visual que 
actúa entre el área parietal derecha (BA 7), el área pre-motora (BA 6) y el lóbulo 
frontal inferior derecho (BA 47). Lo que sigue siendo una cuestión interesante es 
cómo se relacionan estos hallazgos con el posible papel de los movimientos 
oculares en el repaso espacial, tal como se describió en el Capítulo 4. 


12.6.4. La distinción visoespacial 


La mayoría de los estudios sobre memoria visual descritos hasta el momento 
consistían en recordar localizaciones espaciales. Sin embargo, otros estudios 
requerían memoria para las formas de los objetos. En un estudio, Smith et al. 
(1995) usaron formas abstractas, y encontraron una actividad del hemisferio 
izquierdo mayor que la obtenida típicamente usando una serie espacial. Sin 
embargo, Courtney et al. (1997), empleando caras, encontraron una mayor 
distribución de la actividad en el hemisferio derecho. Existen varias razones 
posibles que explican esta discrepancia. En primer lugar, parece probable que las 
caras no sean comunes a otros objetos visuales, y que activen una región 
anatómica específica, el área fusiforme facial. Una segunda posibilidad es que 


los sujetos del estudio de Smith et al. hubieran estado usando una codificación 
verbal que les ayudara a recordar las formas abstractas. Es difícil impedir que los 
sujetos usen algún tipo de codificación verbal, incluso cuando sea 
contraproducente (Brandimonte et al. , 1992). 


Smith y Jonides (1999) interpretan la distinción visoespacial (ver Capítulo 4), 
basándose en estudios sobre primates no humanos que a su vez proporcionan 
evidencias de dos contribuciones distintas a la memoria visoespacial, 
compuestas por una corriente ventral relacionada con la codificación de 
información sobre objetos, y una corriente dorsal relacionada con información 
espacial (Mishkin et al. , 1983; Wilson et al. , 1993). Revisando una serie de 
estudios sobre memoria de trabajo visoespacial, Smith y Jonides (1999) relataron 
que la memoria para la localización de un objeto tendía a activar regiones más 
dorsales que la memoria del objeto mismo. Después siguieron realizando un 
metaanálisis de los estudios sobre memoria de trabajo visual. Los resultados 
combinados se muestran en la Fig. 12.2, que ilustra la tendencia estadísticamente 
significativa de la memoria de objetos a activar el área ventral, y la tendencia de 
la memoria espacial a activar el área dorsal. Por otro lado, sin embargo, para el 
ojo inexperto uno de los rasgos más chocantes de la Fig. 12.2 es el grado de 
variabilidad dentro de esta tendencia global significativa. Volveremos a este 
punto más tarde. 
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Fig. 12.2. Datos combinados procedentes de estudios sobre MCP para objetos 
visuales (rosa) o localización espacial (azul). La diferencia se da principalmente 
entre una localización ventral para los objetos, y dorsal para los lugares. Datos 
de Smith y Jonides, 1999. Figura 4. En: «Almacenamiento y procesos ejecutivos 
en los lóbulos frontales», Science, 283, 1657-1661. Reproducido con el permiso 
de AAAS. Ver la Ilustración 3 para una versión en color de esta figura. 


Parecería como si el bucle fonológico se prestara más fácilmente al control 
experimental, y por tanto ofreciera una mejor estimación de la inherente 
variabilidad de los resultados procedentes de los estudios con escáner sobre la 
memoria de trabajo. Smith y Jonides presentan un metaanálisis semejante para la 
memoria de trabajo verbal (ver Fig. 12.3). Aquí, el patrón es algo más claro, con 
una activación del hemisferio izquierdo claramente mayor que la del derecho, y 
estudios en los que se maximiza el almacenamiento dando lugar a la activación 
de las regiones más parietales, mientras que en aquellos en los que se acentúa el 
procesamiento ejecutivo la activación es más frontal. No obstante, sigue siendo 
saludable percibir el grado de variabilidad. 


Fig. 12.3. Datos combinados de estudios que incluyen MCP para material verbal 
(a), O almacenamiento más procesamiento ejecutivo (b). En cada caso las tres 
figuras representan el lugar de activación como si lo viéramos a través de un 
«cerebro de cristal» visto de lado (sagital), de frente (coronal) o desde arriba 

(axial). En: Smith, E. E. €: Jonides, J. (1999), «Almacenamiento y procesos 
ejecutivos en los lóbulos frontales», Science, 283, 1657-1661. Reproducido con 
el permiso de AAAS. 


12.7. Imágenes del ejecutivo central 


Quizá el programa de investigación más influyente basado en la neuroimagen, 
fue el programa asociado con los pioneros estudios llevados a cabo por Posner y 
Raichle (1994), cuyo trabajo sobre atención visual se convirtió en el punto de 
partida para convencer al campo de estudio de que esta era una metodología que 
podía sacar provecho del avance de la neurociencia cognitiva. Estudiando la 
atención visual con la metodología TEP concluyeron que el cambio de atención 
de un objeto a otro implicaba tres procesos distintos, cada uno asociado con un 
lugar anatómico diferente. El primero, desligado del estímulo inicial, implicaba 
una actividad en el parietal derecho. El movimiento de los ojos requiere pues la 
activación del colículo superior, una gran zona en la mitad del cerebro. A esto le 
sigue la actividad en el pulvinar, un núcleo del tálamo que acentúa la actividad 
frontal (Posner y Fan, 2004). 


El coherente y consistente programa de investigación de Posner parece generar 
un convincente marco para un sistema de control atencional que puede estar 
fraccionado en subcomponentes, que a su vez se asocian con regiones 
específicas del cerebro. Sin embargo, el trabajo se centró muy específicamente 
en la atención visual en vez de en el control ejecutivo en general. La posibilidad 
de usar la neuroimagen para separar los procesos que subyacen al control 
ejecutivo ha captado posteriormente la atención de muchos laboratorios, 
produciendo una gran cantidad de descubrimientos. Al igual que en el caso de 
los estudios de lesiones, las evidencias señalan fuertemente la importancia de los 
lóbulos frontales en el funcionamiento del ejecutivo central, pero de nuevo, al 


igual que en los estudios de lesiones, a medida que las cuestiones se hacen más 
precisas, el grado de acuerdo disminuye. 


12.7.1. La tarea N-back 


Una de las tareas más populares para estudiar la función ejecutiva es la tarea N- 
back, que, como describimos previamente, tiene la ventaja de que requiere el 
mantenimiento activo del material en la memoria inmediata, bajo condiciones en 
las que la carga en memoria puede modificarse sistemáticamente mientras que 
los rasgos superficiales de la tarea permanecen constantes. También tiene la 
ventaja de que puede ser usada tanto con materiales verbales como no verbales. 
Usando este método, Braver et al. (1997) observaron una activación bilateral en 
las áreas prefrontal dorsolateral, frontal inferior y parietal, con un aumento lineal 
del nivel de activación con la carga. Debemos recordar que Jonides et al. (1997) 
y Smith et al. (1996) encontraron lo mismo, usando material tanto verbal como 
no verbal, y encontraron la esperada lateralidad, por la que la tarea verbal 
impacta particularmente sobre el hemisferio izquierdo, y la no verbal impacta 
sobre el derecho. 


El uso frecuente de la tarea N-back ha permitido que Owen et al. (2005) 
pudieran conducir un metaanálisis, que se muestra en la Fig. 12.4. El panel 
superior muestra la activación cuando se combinan tareas N-back verbales, 
espaciales y con objetos, usando en cada caso el control para ese estudio 
individual como línea base individual, antes de combinar los resultados. En 
líneas generales, existe una implicación bilateral clara de los lóbulos frontales y 
del área parietal, consistente con la idea de que están implicados tanto el 
ejecutivo central como los subsistemas visoespacial y fonológico. El otro panel 
muestra los resultados para las tareas verbales, en las que de nuevo hay una clara 
implicación bilateral frontal y un énfasis sobre la actividad del hemisferio 
izquierdo, tal como cabría esperar si el almacén fonológico estuviera implicado. 
Los datos son menos claros en el caso de los dos componentes visoespaciales, 
que de nuevo implican una activación frontal, junto con una mayor evidencia de 
la implicación del hemisferio derecho. El número de áreas con actividad 
significativa es algo menos que para las tareas verbales. Sin embargo, esto 
simplemente puede estar reflejando el menor número de estudios que 


contribuyen a estos análisis, haciendo por tanto que sea menos probable una 
activación estadísticamente significativa. En general, sin embargo, el patrón es 
consistente con el supuesto de que la tarea N-back es demandante, y que tiene un 
patrón diferente para tareas verbales y visoespaciales. La amplitud de la 
activación es consistente con la idea de que la tarea es efectiva para sobrecargar 
la memoria de trabajo, pero es menos apropiada para otros propósitos más 
analíticos. 


Todas las n-back 


Omm Amm 
m 
Identidad verbal 


Omm 4mm 


28mm 
Identidad no 0 


Omm 4mm 


32mm 


PE no verbal 


Omm 4mm 


32mm 


SS: 
3 3 3 - 


p- 
O :0:oO 


12mm 
m 40mm 
12mm 


pS 

= 
<> 2 

3 a 


Le 

co 

== 
==> 3 


Fig. 12.4. Mapas metaanalíticos para todos los estudios n-back combinados 
(panel superior), tareas que implican memoria verbal (segundo panel), aquellas 
que implican el recuerdo no verbal de la identidad (tercer panel) y aquellas que 

consisten en el recuerdo de lugares (panel inferior). (De Owen et al. , 2005, 
Figura 1.) En: «Paradigma N-Back de la memoria de trabajo: un metaanálisis de 

los estudios normativos de neuroimagen funcional», Human Brain Mapping, 25, 
46-59. Reproducido con el permiso de John Wiley €z Sons, Inc.. Por favor, ver 
Nustración 4 para una versión en color de esta figura. 


12.7.2. Producción aleatoria 


Otra tarea que demanda control ejecutivo es la producción aleatoria. Frith et al. 
(1991) estudiaron el rendimiento cuando se pedía a los sujetos que presionaran 
teclas al azar, comparándolas con una condición en la que los sujetos 
presionaban las teclas en respuesta a un estímulo concreto. Encontraron una 
activación bilateral del área dorsolateral. En una tarea equivalente que consistía 
en la comparación entre contar y producir números aleatorios, Jahanshahi et al. 
(2000) también encontraron una activación dorsolateral bilateral, pero mientras 
que la activación del hemisferio izquierdo correlacionó negativamente con el 
grado de aleatoriedad conseguido, esta relación no se dio para el hemisferio 
derecho. 
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Ilustración 1. La figura superior representa una reconstrucción del tracto 
arqueado que conecta los centros de Broca y Wernicke. (Datos de Catani et 
al. , 2005). El panel inferior representa una posible localización del modelo 

del bucle fonológico (Catani et al. , 2005). Ver también Figura 12.1. 


Ilustración 2. Comparación sistemática de la actividad frontal asociada a 
cinco demandas cognitivas. Las activaciones se corresponden con estudios 
de respuestas en conflicto (verde), novedad en la tarea (rosa), número de 
elementos en la memoria de trabajo (amarillo), demora en la memoria de 
trabajo (rojo) y dificultad perceptiva (azul). Se muestra una perspectiva de 
la zona lateral (fila de arriba) y de la zona media (fila del medio) de cada 
uno de los hemisferios, junto con una toma de todo el cerebro visto desde 
arriba (abajo a la izquierda) y desde abajo (abajo a la derecha) (CC: 
Cuerpo Calloso; SFI: Surco frontal inferior; FS: Fisura de Silvio). (Figura 2 
de Duncan y Owen, 2000). Ver también Figura 12.5. 
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Ilustración 3. Combinación de datos de estudios que incluyen MCP para 
objetos visuales (rosa) o MCP para la localización espacial (azul). La 
principal diferencia aparece en la zona ventral para los objetos, y la zona 
dorsal para las localizaciones. Datos de Smith y Jonides, 1999. Figura 4. Ver 
también Figura 12.2. 
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Ilustración 4. Mapas de activación metaanalítica para todos los estudios n- 
back combinados (panel superior), tareas que incluyen memoria verbal 
(segundo panel), aquellas que implican recuerdo no verbal de la identidad 
(tercer panel) y aquellas que implican recuerdo de lugares (panel inferior). 


Otra versión de la tarea de producción consiste en la autoordenación, en la que 
los sujetos tienen que hacer una serie de elecciones. En cada test se presentan 
una serie de ítems, y se le pide al sujeto que elija un ítem distinto en cada 
ensayo, intentando no repetir. Esta tarea, al igual que la tarea de producción 
aleatoria, tiende a verse perjudicada en pacientes del lóbulo frontal (Petrides y 
Milner, 1982). Cuando la tarea implica señalar diseños abstractos, se activa 
principalmente el área prefrontal dorsolateral derecho (Petrides et al. , 1993), y 
cuando hay que señalar dígitos de forma autoordenada hay una activación 
bilateral del área prefrontal dorsolateral, lo mismo que ocurre con una tarea que 
implique controlar secuencias de dígitos para un ítem específico. 


12.7.3. Rendimiento en tareas dobles 


Como dijimos anteriormente, se supone que una de las funciones del ejecutivo 
central consiste en la capacidad para realizar dos tareas al mismo tiempo 
(Baddeley et al. , 1991). D'Esposito et al. (1995) estudiaron tareas que 
implicaban rotación espacial y juicios semánticos, de forma independiente y 
combinada. Encontraron que cuando se combinaban ambas tareas las áreas 
prefrontales dorsolaterales se activaban, sugiriendo que esta área es responsable 
de la capacidad para combinar dos tareas. Desafortunadamente esto no ha sido 
algo fácil de demostrar. Klinberg (1998) pidió a sus sujetos que realizaran juicios 
de luminosidad y tareas de percepción de tonos independientemente y en 
combinación, pero no encontraron un área que respondiera específicamente a la 
combinación de tareas. Goldberg et al. (1998) estudiaron el Test de Clasificación 
de Tarjetas de Wisconsin y el enmascaramiento auditivo, encontrando que el 
grado de actividad dorsolateral realmente se reducía cuando las dos tareas se 
combinaban. Fletcher et al. (1995) también encontraron una reducción de la 


activación dorsolateral cuando se combinaba una tarea de codificación verbal 
con una tarea visomotora. Conviene mencionar quizá que tanto la tarea de 
clasificación de tarjetas de Goldberg et al. como la tarea de elaboración verbal de 
Fletcher et al. implicaban un procesamiento ejecutivo y una activación frontal 
cuando se realizaban en solitario. La reducción de esta activación podría reflejar 
posiblemente el abandono de una estrategia atencionalmente demandante 
empleada en condiciones de tarea única, como consecuencia de la necesidad de 
realizar una segunda tarea atencionalmente demandante (Rosen y Engle, 1994). 


La cuestión de la estrategia que usa el sujeto es, por supuesto, crucial en los 
estudios cognitivos, tanto si se usan métodos conductuales como de 
neuroimagen. Sin embargo, mientras que los estudios puramente conductuales 
típicamente abordarían el tema usando una serie de experimentos convergentes 
que explícitamente investigaran estos temas (ver por ejemplo el estudio de 
Klauer y Zhao [2004] descrito en el Capítulo 4), raramente ocurre así en la 
investigación con imágenes, donde los temas del coste y la disponibilidad a 
menudo han tendido a originar conclusiones basadas en un solo experimento 
usando un pequeño grupo de sujetos. Por suerte, esto está cambiando a medida 
que se desarrolla el campo. 


12.7.4. Planificación 


La misma falta de unanimidad aparece en los estudios sobre planificación, 
usando versiones de la tarea de la Torre de Hanoi. Por ejemplo, Baker et al. 
(1996) observaron una activación prefrontal dorsolateral derecha junto con una 
activación bilateral en las áreas premotora y parietal, que no fue hallada por 
Owen et al. (1999), quienes principalmente observaron una activación prefrontal 
dorsolateral izquierda. Parece probable que las sutiles diferencias en la 
naturaleza de las dos tareas hayan originado la discrepancia. Sin embargo, esto 
nos lleva a cuestionarnos sobre el grado de replicabilidad y coherencia 
encontrado en los estudios sobre esta área. 


12.8. Metaanálisis del procesamiento ejecutivo 


Duncan y Owen (2000) abordaron este tema usando un metaanálisis en el que 
combinaron datos procedentes de una gran serie de estudios, con la esperanza de 
revelar un claro mapa de los subprocesos ejecutivos específicos en base a 
localizaciones anatómicas concretas. Empezaron categorizando las tareas 
empleadas en los estudios en cinco grupos separados, cada uno plausiblemente 
independiente de los otros cuatro a un nivel conductual y cognitivo. Se 
componían de (1) discriminación auditiva, (2) producción de una respuesta a un 
ritmo propio, (3) cambio de tarea, (4) resolución de problemas espaciales y (5) 
procesamiento semántico de palabras. A pesar de la amplia variedad de tareas, 
todas parecían mostrar una activación máxima dentro de un área relativamente 
estrecha, que comprende las regiones dorsolateral media, ventrolateral media y 
la región cingulada anterior dorsal. 


Por tanto, los análisis de los datos combinados sí arrojaron de hecho un grado de 
regularidad sorprendente, aunque no tal como se esperaba, unida a los procesos 
ejecutivos implicados. Por ello, las cinco medidas parecen depender fuertemente 
de tres regiones frontales, el área cíngulada dorsal y anterior, el área dorsolateral 
media y ventrolateral media. Duncan y Owen, algo sorprendidos por este patrón, 
usaron una selección de estudios más amplia, esta vez categorizándolos en 
términos de las aparentes demandas de la tarea subyacente. Una vez más, 
seleccionaron cinco subgrupos, compuestos por (1) respuesta a tareas en 
conflicto como el test de Stroop, (2) tareas que implican el procesamiento de 
material nuevo o de procedimientos, (3) tareas con una alta carga de memoria de 
trabajo, (4) tareas que requieren retener a lo largo de una larga demora de 
memoria de trabajo y (5) tareas que implican dificultad perceptiva. Como 
muestra la Fig. 12.5, emergieron exactamente las mismas tres regiones, 
concretamente, el área cingulada anterior, el área dorsolateral media y 
ventrolateral media de los lóbulos frontales, independientemente de la naturaleza 
de la demanda ejecutiva. 


Duncan y Owen interpretaron sus resultados con cierta precaución, señalando 
que el fracaso de todos los datos actuales para distinguir anatómicamente entre 
toda la serie de tareas ejecutivas no significa en principio que no sean 
discriminables. Puede pasar simplemente que los métodos actuales no posean la 
suficiente resolución como para poder hacer finas distinciones a través de 
estudios en los que es probable que haya sutiles diferencias, tanto en la 
metodología conductual como en la de neuroimagen. Es más, las tareas nunca 


proporcionan medidas puras de los procesos cognitivos subyacentes, por ello 
muchas tareas ejecutivas aparentemente diversas es probable que tengan al 
menos algunos procesos en común. Duncan y Owen también señalan que hay 
algunas diferencias que parecen estar presentes. Por ejemplo, los estudios 
relacionados con el recuerdo de la memoria episódica producen activaciones que 
son consistentemente anteriores a aquellas derivadas de la serie de medidas 
ejecutivas. 


Tal como señalaron Duncan y Owen, muchas áreas pequeñas dentro de los 
lóbulos frontales que puede que no sean detectadas por la £MRI, parecen estar 
conectadas con otras múltiples regiones distribuidas más ampliamente (Pucak et 
al. , 1996). Una razón más para tomar precauciones surgió a raíz de los estudios 
de registro de unidades únicas, los cuales han identificado ciertas neuronas 
frontales, distribuidas ampliamente tanto en la región ventral como dorsal, que 
parecen alternar de la codificación de objetos a la codificación de información 
espacial, dependiendo de lo que sea crucial para un test dado (Rao, 1997). Si hay 
este grado de flexibilidad al nivel de las neuronas individuales, ¿no habrá una 
cantidad similar de variabilidad en el amplio nivel regional de análisis que 
proporcionan los estudios de TEP y £MRT? Finalmente, incluso si las unidades 
individuales son estables en su función, estudios de estimulación de Ojemann 
(1994) sugieren que la función puede variar dramáticamente en unos pocos 
milímetros, un nivel de análisis que va más allá de la capacidad discriminativa 
de la £MRI. Sus estudios incluían a pacientes que habían pasado por 
neurocirugías para aliviar la epilepsia. Una forma de evitar la retirada quirúrgica 
de tejido que cognitivamente es crucial es explorando la función del área en 
cuestión mediante estimulación eléctrica. Usando este método, Ojemann 
encontró que la estimulación de un punto concreto impediría nombrar, y que la 
estimulación unos milímetros más allá impediría contar. Estos resultados no 
significan, por supuesto, que un tipo de procesamiento dado esté limitado a esta 
micro región, pero sí sugiere que la arquitectura podría variar en una escala que 
sería difícil de detectar mediante los actuales procedimientos con imágenes. 


Fig. 12.5. Comparación sistemática de las activaciones frontales asociadas con 
cinco demandas cognitivas. Las activaciones proceden de estudios de respuestas 
en conflicto (verde), novedad en la tarea (rosa), número de elementos en la 
memoria de trabajo (amarillo), demora en la memoria de trabajo (rojo) y 
dificultad perceptiva (azul). Las imágenes mostradas son una perspectiva lateral 
(fila superior) y media (fila del medio) de ambos hemisferios, junto con una 
perspectiva de todo el cerebro desde arriba (inferior izquierda) y desde abajo 
(inferior derecha). (CC: Cuerpo Calloso; SIF: Surco Inferior frontal; FS: Fisura 
de Silvio.) (Figura 2 de Duncan y Owen, 2000). En: «Regiones comunes del 
lóbulo frontal humano recopiladas a partir de diversas demandas cognitivas», 
Trends in Neurosciences, 23, 475-483. Reproducido con el permiso de Elsevier. 
Por favor, ver la Ilustración 2 para una versión en color de esta figura. 


12.9. Procesos de recuperación de imágenes 


Una crítica común del trabajo con imágenes es que, aunque confirma 
conclusiones previas basadas en estudios conductuales y en el trabajo con 
pacientes neuropsicológicos, es esencialmente confirmatoria, y nos ha dicho 
muy pocas cosas nuevas. Probablemente el primer contraejemplo a esta 
afirmación lo ofreció el uso de imágenes para estudiar procesos de recuperación. 
Aquí, la hipótesis de la Asimetría Hemisférica en Codificación y Recuperación 
(HERA)* va más allá de las conclusiones extraídas a partir de los estudios 
conductuales. Propuesta originalmente por Tulving et al. (1994), defiende, sobre 
la base de una serie de estudios TEP, que mientras que la codificación en 
memoria y la recuperación de la memoria semántica depende principalmente del 
área frontal izquierda, la recuperación de la memoria episódica depende 
principalmente del lóbulo frontal derecho. 


Esto fue una afirmación algo contraintuitiva, dado que parece haber muy pocas 
evidencias en los estudios de lesiones neuropsicológicas de un papel crucial de la 
región frontal derecha en la recuperación episódica. Esto ha generado un 
considerable número de estudios desde distintos laboratorios. Estos estudios 
fueron revisados por Nyberg et al. (1996), quienes mostraron 16 estudios de TEP 


que examinaban específicamente la codificación en memoria, de los cuales 13 
identificaban al área prefrontal izquierda como un área crucial. De los 33 
estudios relacionados con la recuperación episódica, 29 implicaban una 
activación prefrontal derecha. En otros estudios con fMRI se extrajeron 
resultados ampliamente similares (e.g., Buckner et al. , 1998). 


Sin embargo, la hipótesis HERA no ha quedado libre de críticas. Entre las 
objeciones se incluye el uso de una línea base no-memorística, la cual exageraría 
la influencia de procesos cognitivos más generales, los cuales frecuentemente 
implican una activación frontal derecha (Nolde et al. , 1998a). Nolde et al. 
(1998b) demuestran que cuando se usa una tarea de reconocimiento episódico 
más difícil, en la que se debe evaluar la fuente de memoria, predomina la 
actividad frontal izquierda, mientras que en un estudio de Ranganath y Paller 
(2000) con medidas ERP se llegó a una conclusión similar. Presentaron a sus 
sujetos una secuencia de dibujos de objetos o animales, que estaban 
representados en un formato grande o pequeño. Cuando simplemente se pidió a 
los sujetos que reconocieran si el objeto se había mostrado previamente o no, se 
activó predominantemente la región frontal derecha, pero cuando también se les 
pidió que recordaran si estaban presentados en un formato grande o pequeño, la 
activación fue bilateral. 


La interpretación de las asimetrías que aparecen con frecuencia sigue siendo 
controvertida. Tulving et al. (1994) consideran la activación frontal derecha 
como la firma de un «modo de recuperación» específico que es esencial para una 
recuperación episódica eficiente. Shallice et al. (1994), por otro lado, defienden 
una interpretación en términos de control y verificación de respuestas 
candidatas, en vez de una recuperación per se. No hay duda por tanto que la 
hipótesis HERA ha estimulado interesantes ideas nuevas en el área de la 
recuperación. Sin embargo, sigue siendo controvertida, y probablemente sea 
demasiado pronto como para considerarla un claro ejemplo de la forma en que la 
neuroimagen es capaz de ampliar nuestro conocimiento. 


12.10. Algunas conclusiones 


12.10.1. ¿Aspiraciones alcanzadas? 


¿Qué debería concluir de esta breve incursión en la literatura de la neuroimagen? 
La respuesta a esta cuestión parece depender del énfasis que se ponga en los 
distintos metaanálisis de los numerosos y crecientes estudios. Dejadme 
considerar mi criterio inicial. El primero es la simplicidad y la coherencia. 
Considerando el metaanálisis como un todo, ahí donde las conclusiones parecen 
ser simples, sin embargo, no son coherentes. Por ejemplo, la diferencia 
hemisférica visual-verbal no siempre llega claramente. La distinción entre objeto 
y espacio no parece aplicarse consistentemente en las regiones frontales, a pesar 
de las primeras evidencias procedentes de los estudios con animales y humanos. 
Los datos sobre procesos ejecutivos también están lejos de ser claros. ¿Existen 
muchas áreas frontales diferentes que reflejan procesos ejecutivos distintos, tal 
como Shallice (2002) propone, o como Duncan y Owen sugieren, las distintas 
tareas suponen una demanda sobre una misma gran área? 


Mi segunda aspiración era que los resultados se replicarían a través de 
laboratorios diferentes. Algunas veces ocurre ciertamente así, como en los 
estudios de Paulesu et al. (1993) y de Michigan (Smith et al. , 1996). Sin 
embargo, esta consistencia, no caracteriza el campo de forma más general, como 
se refleja en los metaanálisis. 


Mi tercera aspiración era que los resultados serían ampliamente consistentes con 
los datos existentes sobre estudios de lesiones y con los hallazgos conductuales 
existentes en la psicología cognitiva experimental. En ausencia de conclusiones 
claras a partir de los metaanálisis, es difícil defender la coherencia con fuerza. 
Ocurre casi invariablemente que los autores de los resultados de los estudios 
individuales los relacionan con la evidencia previa y con la teoría existente, y 
típicamente se ha encontrado que son consistentes. Sin embargo, esto podría 
reflejar una justificación post hoc de resultados que son lo suficientemente 
complejos como para permitir interpretaciones múltiples. 


12.10.2. Algunos problemas 


Una valoración de la situación algo menos pesimista sería sugerir que este 
campo todavía no es lo suficientemente coherente y bien controlado como para 


que el metaanálisis sea adecuado. Es probable que nos encontremos con 
problemas al menos en tres niveles. El primero de ellos tiene que ver con los 
paradigmas experimentales utilizados. A menudo son complejos, y tienden a 
estar diseñados principalmente para ser utilizados dentro del contexto de las 
imágenes, en lugar de por su capacidad para proporcionar una medida 
relativamente pura del concepto hipotético o del proceso que constituye el foco 
de estudio. Incluso en tareas relativamente simples como la memoria fonológica, 
aparecen diferencias cruciales. Los estudios cognitivos tienden a usar el recuerdo 
verbal inmediato serial, en el que es probable el repaso subvocal y además 
requiere recordar en orden. Por otro lado, los estudios con escáner incluyen 
típicamente el reconocimiento de un ítem individual a partir de un conjunto, sin 
que normalmente se incluya información sobre el orden. El orden se requiere en 
la tarea N-back, que se considera que mide procesos ejecutivos. Esta tarea sí 
demanda ciertamente manipulación ejecutiva, pero también requiere mantener el 
orden de información, que podría no ser de naturaleza ejecutiva. La situación se 
vuelve aún más compleja cuando uno intenta separar más procesos ejecutivos 
hipotéticos. Probablemente aquí el análisis de tarea sea aún más complejo, 
reflejando nuestra ignorancia comparativa del funcionamiento del ejecutivo 
central a nivel conductual. 


Un problema mayor se relaciona con la estrategia adoptada por el sujeto. Dos 
sujetos, dada la misma tarea y las mismas instrucciones, podrían realizar esa 
tarea de muchas maneras diferentes. En un típico estudio puramente cognitivo- 
conductual, este problema se trataría con una réplica, usando una serie de 
procedimientos diferentes con el objetivo de comprobar la posibilidad de estos 
factores estratégicos (cf. Klauer y Zhao, 2004). Dada la restricción financiera y 
temporal de los estudios con imágenes esto ya no es posible, lo que sospecho 
que da lugar a una importante fuente de inconsistencia potencial tanto dentro de 
un mismo estudio como entre estudios diferentes. 


Probablemente una tercera e importante fuente potencial de «ruido» provenga de 
los aspectos prácticos derivados de la extracción de conclusiones de cada uno de 
los estudios, de la línea base que se usa, de los criterios que se establecen y 
precisamente de cómo se localizan los picos de activación en los lugares 
anatómicos. El empleo de las áreas de Brodman es útil para la comunicación, 
pero hasta donde yo sé, no está clara la importancia funcional de las diferencias 
anatómicas entre localizaciones sobre las cuales Brodman basó su clasificación. 


Estos problemas potenciales no son suficientes como para argumentar en contra 


de un intento del metaanálisis, el cual posee la ventaja potencial de que combina 
datos de muchas fuentes y permite minimizar las diferencias individuales. Sin 
embargo, sí nos advierten a la hora de extraer una conclusión demasiado 
pesimista de estos intentos. 


12.10.3. ¿Y ahora qué? 


¿Cuál es la alternativa? Mi opinión personal es que nos tomemos en serio los 
datos de estudios llevados a cabo en laboratorios que parecen combinar tres 
cosas. Lo primero, buenos psicólogos cognitivos que comprenden la teoría 
subyacente y la metodología requerida en estudios sobre memoria de trabajo. En 
segundo lugar, deberían estar respaldados con la pericia y las facilidades de las 
imágenes de primera calidad. En tercer lugar, el trabajo debería ser parte de un 
programa coherente, en vez de una serie de estudios extraordinarios. Esto no 
implica decir que todos los demás estudios deberían descartarse, tan solo es una 
forma de intentar formarme una idea de esta área importante pero compleja. 


Resumiendo, la neuroimagen proporciona claramente una forma adicional y 
potencialmente importante de investigar la función cognitiva cerebral. En el caso 
de la memoria de trabajo, parece proporcionar evidencia de una amplia 
distinción entre el hemisferio verbal izquierdo y gran parte del procesamiento 
del hemisferio visoespacial derecho, con una distinción adicional entre una 
codificación más ventral de la información de objetos, en contraste con un 
procesamiento más dorsal de la información espacial. La evidencia también 
apoya la idea de que los componentes de almacenamiento temporal de la 
memoria de trabajo tienden a estar asociados con áreas parietales, mientras que 
regiones algo más anteriores dentro de los lóbulos frontales es más probable que 
estén implicadas en la manipulación de información. Los métodos están siendo 
constantemente desarrollados y refinados, por lo que el futuro ofrecerá una 
disociación mucho más fina de la especialización regional. 


Sin embargo, un crítico podría decir que, en comparación con las aspiraciones 
iniciales, los resultados obtenidos hasta el momento han tendido a reforzar las 
teorías existentes, en vez de desarrollar nuevos conocimientos. Esto no es por 
falta de especulación teórica, sino más bien refleja una falta de acuerdo entre los 


estudios relacionados tanto con datos como con interpretaciones. Los datos son 
muy complejos y molestos, y consecuentemente la situación de los paradigmas 
sobre las teorías tiende a ser equívoca. Sin embargo, es importante tener en 
cuenta que los datos que hemos estado discutiendo tienen que ver simplemente 
con la localización anatómica, lo que algunas veces se ha denominado 
despectivamente como «la nueva frenología». Mi propio punto de vista es que el 
verdadero poder de las técnicas emergerá con el rápido desarrollo actual de las 
nuevas medidas que poseen dos ventajas sustanciales. La primera relacionada 
con la habilidad para identificar sistemas de procesamiento sobre la base de 
asociaciones entre áreas activas, usando modelos causales dinámicos (Friston et 
al. , 2003), un poderoso método estadístico para establecer conexiones 
funcionales entre áreas del cerebro. La segunda concierne a la mayor resolución 
temporal de la EGM, que proporciona capacidad para identificar el orden 
temporal en el que aparecen las diferentes activaciones y relacionarlo con 
modelos cognitivos bien desarrollados. 


Notas al pie 


* En inglés se corresponde con las siglas MRI de « Magnetic Resonance 
Imaging». N. de la T. 


* Son las siglas del inglés «Hemispheric Encoding Retrieval Asymmetry». N. de 
la 'L 


CAPÍTULO 13 


Memoria de trabajo y conducta social 


Los capítulos previos han variado considerablemente en cuanto a contenido y 
metodología, pero todos tienen en común una preocupación directa por la 
memoria de trabajo. Este capítulo, y de hecho el resto del libro, parten de este 
punto, centrándose en la tarea de situar el concepto de memoria de trabajo 
multicomponente en un contexto más amplio. Muy poco de lo que sigue a 
continuación describe investigaciones que aborden directamente la memoria de 
trabajo. Espero convencerte, sin embargo, de que las áreas que se discuten, 
concretamente la psicología social, la cognición y la emoción, la conciencia y el 
control de la acción, poseen vínculos importantes con la memoria de trabajo. 
Creo que estas conexiones pueden proporcionar un modo potencialmente 
fructífero de ver los campos en cuestión, a la vez que se enriquece el concepto de 
memoria de trabajo, situándolo en un contexto más amplio. Sin embargo, al 
mismo tiempo, es importante tener en cuenta que de ningún modo soy experto en 
ninguno de estos campos. Si, tal como espero, los lectores se animan a explorar 
estos nexos de unión con más profundidad, harían bien en consultarlo con 
colegas mejor cualificados que yo. 


13.1. ¿Qué controla la conducta? 


Norman y Shallice (1986) propusieron que la conducta está controlada por dos 
procesos. El primero implica un control mediante esquemas automáticos, que 
permiten patrones de conducta bien establecidos y habituales para controlar 
actividades rutinarias. Por tanto, las actividades habituales se basan en un control 
ambiental y no en procesos ejecutivos, y por ello reclaman poca demanda sobre 
los procesos atencionales. Cuando el control automático resulta inadecuado, otro 
componente más demandante atencionalmente, el Sistema Atencional Supervisor 


(SAS), es capaz de intervenir y posiblemente resolver el problema en curso. 
Estos problemas pueden surgir, bien por un estrecho conflicto entre los esquemas 
en competición, o bien por falta de información suficiente. Propongo que este 
último componente, el SAS, es un posible mecanismo para el ejecutivo central, 
que es un componente de la memoria de trabajo (Baddeley, 1986). 


Sin embargo, una teoría adecuada de la memoria de trabajo necesitaría abordar 
ambos componentes: mientras que en los últimos años la psicología cognitiva se 
ha dirigido hacia el control ejecutivo en vez de hacia la influencia de los hábitos, 
ha ocurrido justo lo contrario con la psicología social, donde ha existido un 
extenso trabajo acerca de la influencia automática de las actitudes y de los 
prejuicios sobre el comportamiento. Puede que aparezcan claras discrepancias 
entre las actitudes conscientes, declaradas socialmente deseables, y la conducta 
real que refleja un prejuicio implícito. Esto ha llevado a los psicólogos sociales a 
desarrollar medidas implícitas acerca de los patrones habituales del pensamiento 
y de los valores. El poder de estos procesos implícitos ha promovido el 
desarrollo de un intento de teoría que acentúe el control de la conducta a través 
del ambiente o en términos del modelo de Norman y Shallice, a través de hábitos 
y esquemas y no a través del SAS. 


Este enfoque fue presentado por Bargh y Ferguson (2000). De hecho, ellos 
fueron más lejos, proponiendo que toda conducta, tanto si está controlada 
automáticamente a través de esquemas existentes como si está controlada 
aparentemente mediante procesos que requieren un gran esfuerzo y son 
deliberados, es esencialmente equivalente en todo, excepto que hemos 
descubierto el mecanismo para una de las versiones pero no para la otra. Ellos 
proponen que «La distinción entre procesos automáticos y controlados... 
desaparece por completo porque estos procesos controlados están controlados 
ellos mismos por determinadas estructuras con objetivos automáticos» (Bargh y 
Ferguson, 2000, p. 939). Tanto si aceptamos que esta es una interpretación 
razonable de la evidencia disponible como si no lo aceptamos, no hay duda de 
que una teoría adecuada del control ejecutivo al menos debe tener en cuenta los 
aspectos del sistema más automáticos y esquemáticamente dirigidos. 


13.2. Hábitos, esquemas y control determinístico 


13.2.1. ¿Control sin conciencia? 


La posibilidad de que el procesamiento no consciente pueda influir en la 
conducta ha sido un foco de controversia importante entre los psicólogos 
cognitivos de los últimos años. En 1970 y 80 se interesaron principalmente por 
el tema de la percepción sin conciencia (e.g., Marcel, 1983; Weiscrantz, 1986), y 
en 1980 y 90 el interés se amplió al estudio de la memoria implícita y del 
aprendizaje (e.g., Schacter, 1994; Shanks y St John, 1994). En la típica serie de 
estudios sobre el procesamiento inconsciente visual de palabras, Marcel (1983) 
desarrolló un paradigma en el que se pedía al sujeto que procesara una palabra 
presentada brevemente, bien pronunciándola, decidiendo si se trataba de una 
palabra o de una no-palabra, o bien juzgando su significado. Se demostró que el 
rendimiento en estas tareas podría verse influido por un efecto de preparación ( 
priming) relacionado con la presentación de una palabra previa. El efecto 
priming puede darse incluso si la palabra previa ha sido presentada muy 
brevemente, e inmediatamente a continuación le sigue un patrón aleatorio 
disimulado, condiciones bajo las cuales el sujeto típicamente niega haber 
percibido la primera palabra. Por ejemplo, presentar la palabra dinero 
disimuladamente llevará al sujeto a interpretar la palabra ambigua banco en 
términos de una institución financiera, y no como la orilla del río. En otro 
estudio, presentar y enmascarar la palabra doctor facilitó la lectura posterior de 
la palabra asociada enfermera (Marcel, 1983). No hay duda de que para obtener 
estos efectos se requiere una gran habilidad experimental, al intentar evitar que 
el sujeto sea consciente, pero al mismo tiempo asegurándonos de que el 
procesamiento es posible, aunque en general la presencia de un procesamiento 
perceptivo implícito ahora parece estar bien establecida no solo para las 
palabras, sino también para otros muchos estímulos (Cheesman y Merikle, 
1984). 


En el área de la memoria a largo plazo, también está bien establecida la 
importancia de los factores implícitos. En el caso, por ejemplo, de pacientes 
densamente amnésicos, la presentación previa de una palabra o de un boceto 
facilita el procesamiento posterior tanto en amnésicos como en sujetos control, a 
pesar de que los amnésicos niegan haber experimentado la presentación previa 
(Warrington y Weiskrantz, 1968). Por ejemplo, la presentación previa de una 
palabra como AMBULANCIA ayudará tanto a los amnésicos como a los sujetos 
normales a conseguir las letras necesarias para completar la secuencia 


_M_U_A C_A, aunque los pacientes amnésicos no tengan el recuerdo de haber 
visto la palabra anteriormente (ver Baddeley, 1998, Capítulo 9, para ampliar 
información). Estos efectos de facilitación han sido ampliamente estudiados, y 
han demostrado depender de variables muy distintas a las que influyen en la 
capacidad para recordar conscientemente haber experimentado recientemente 
esos ítems (Roediger, 1990; Schacter, 1994; Squire, 1992). 


Los métodos de priming implícito han sido ampliamente usados en la psicología 
social, donde tienen la ventaja, frente otras técnicas más explícitas, de que 
distinguen el propósito de estudio, y por tanto se minimiza la posibilidad de que 
los sujetos puedan estar comportándose de una forma determinada para 
satisfacer o posiblemente refutar las expectativas del experimentador. 
Normalmente estos estudios van más allá de la simple demostración de las 
influencias implícitas sobre la percepción o la memoria, empleándose estas 
influencias para estudiar temas complejos como las actitudes, los logros o el 
comportamiento social. Estos estudios en psicología social ofrecen una 
importante fuente de evidencias relacionadas con influencias aún más implícitas 
sobre el control ejecutivo. Describiré una muestra de estos estudios antes de 
seguir discutiendo su posible interpretación. 


Uno de estos primeros fenómenos a estudiar fue la conducta mimética. Esta 
conducta aparece mayoritariamente en las bandadas de pájaros o en los bancos 
de peces, donde todos los miembros del grupo parecen cambiar de dirección al 
mismo tiempo. En el caso de los humanos, esta imitación es ligeramente menos 
obvia, pero sin embargo está bien establecida. Una de las formas más corrientes 
de esta aparente conducta de imitación aparece en la postura adoptada durante 
una conversación, en la que de pronto uno se da cuenta de que ambos miembros 
de la conversación han adoptado la misma postura, por ejemplo, cruzando los 
brazos, o con la mano en el bolsillo. En un estudio experimental sobre este 
efecto, Chartrand y Bargh (1999) pidieron a un sujeto y a otro sujeto cómplice 
del experimento que examinaran conjuntamente una serie de fotografías. El 
cómplice del experimento tenía que tocarse la cara frecuentemente, o bien 
balancear el pie. Las grabaciones en vídeo del otro sujeto fueron juzgadas 
independientemente y se contó el número de veces que se tocaba la cara y que 
balanceaba el pie. Se encontraron claras evidencias de imitación. Cuando el 
cómplice se tocaba la cara frecuentemente, también lo hacía el otro sujeto. 
Cuando balanceaba el pie, el otro sujeto también lo hacía. 


Se ha sugerido que esta conducta intenta establecer implícitamente un rapport 


(relación) positivo entre las dos personas que están en interacción. Esto se puso a 
prueba en un segundo estudio; esta vez el cómplice imitaba activamente las 
acciones del otro sujeto, o bien se abstenía de hacerlo. Posteriormente los sujetos 
calificaron a los cómplices imitadores como más agradables. Claramente, esta 
imitación necesita ser sutil: imitar a alguien consciente y claramente, «copiar su 
conducta», se tiende a considerar como algo irónico e insultante. 


La tendencia de imitar inconscientemente fue percibida por William James 
(1890), quien se refirió a ella como «acción ideomotora», por la que el 
pensamiento lleva a la acción mediante «el libre discurrir de la conciencia». Una 
interpretación más reciente, proporcionada por el descubrimiento en los estudios 
de registro de células únicas, de las citadas neuronas espejo, por las cuales 
ciertas células se activan por la ejecución de una acción, así como por la 
percepción de esta acción ejecutada por otro (Rizzolati y Arbib, 1998). La 
neuronas espejo parecen estar particularmente asociadas al área premotora del 
cerebro. 


13.2.2. Percepción implícita 


El trabajo de investigadores como Marcel ha sido ampliado dentro del campo 
social, con la demostración de que las actitudes emocionales se pueden ver 
facilitadas implícitamente. Por ello, los sujetos a quienes se les pide que realicen 
una tarea de decisión léxica en la que deben categorizar una cadena de letras 
como una palabra o como una no-palabra responden más rápidamente cuando la 
palabra ha estado precedida de una facilitación proporcionada por un tono 
emocional similar. Por ello, si se presenta la palabra « agradable» de forma 
disimulada y brevemente la decisión posterior de que «alegre» es una palabra 
real se verá acelerada, mientras que el juicio similar con la no-palabra « 
mournful» se verá enlentecido (Bargh y Ferguson, 2000). La preparación 
subliminal verbal también puede influir en la estimación de tu propio estado 
anímico (Chartrand y Bargh, 1999), al igual que lo hace el tiempo climatológico. 
En un estudio, se telefoneó a un grupo de personas en un desagradable día gris, o 
bien en un día soleado, preguntándoles su opinión acerca de una serie de temas. 
Las opiniones fueron más negativas cuando el tiempo era malo. Sin embargo, 
cuando primero se les preguntaba por el tiempo, el efecto desaparecía, como si 


hubieran sido capaces de tenerlo en cuenta en sus juicios posteriores (Schwarz y 
Clore, 1983). Retomaremos este punto cuando discutamos lo que implica decir 
que la conducta está «determinada» o «controlada». 


Finalmente, se sabe desde hace muchos años que la compatibilidad estímulo- 
respuesta puede verse influida por el tono emocional. Solarz (1960) demostró 
que cuando se pedía a los sujetos que clasificaran un estímulo como «bueno» o 
«malo» presionando o tirando de una palanca, respondían más rápidamente 
cuando se les pedía que respondieran alejando la palanca cuando era «malo» y 
acercándosela cuando era «bueno». Chan y Bargh (1999) demostró que este 
efecto también se daba cuando las palabras emocionales eran usadas como 
palabras facilitadoras, presentadas por debajo del umbral de la conciencia. Por 
tanto, parece que tal como Bargh dice, el estímulo emocional del que el sujeto no 
es consciente, es capaz de influir en la percepción, el humor, la decisión y la 
conducta motora. 


13.2.3. Emociones y actitudes 


Hay evidencias considerables que sugieren que los estímulos de entrada son 
automáticamente evaluados como positivos o negativos (ver Capítulos 14 y 15), 
y son capaces de actuar como facilitadores emocionales, influyendo en la 
evaluación de un ítem que les siga inmediatamente, incluso cuando la 
facilitación emocional se enmascare, situándose por tanto por debajo del umbral 
de conciencia del sujeto. Por ejemplo, Krosnick et al. (1992) presentaron unas 
láminas de personas ocupándose de sus actividades diarias: cada lámina era 
precedida de otra lámina relacionada emocionalmente, de forma positiva, como 
por ejemplo una cesta de gatitos, o bien de forma negativa, como un cesto lleno 
de serpientes. Después se examinaron las actitudes mostradas por los sujetos al 
realizar tareas neutrales. Las personas a las que subliminalmente les presentaron 
láminas agradables fueron evaluadas más positivamente que aquellas a las que se 
les presentaron imágenes negativas. 


Se han encontrado efectos de facilitación similares para palabras (Fazio, 1986), e 
incluso para no-palabras y formas sin significado, encontrando que las evaluadas 
negativamente facilitan el rechazo y las valoradas de forma positiva facilitan 


respuestas de aproximación (Duckworth et al. , 2002). 


13.2.4, Motivos y logros 


Los ejemplos que hemos presentado hasta el momento se refieren a niveles de 
influencia que posiblemente solo puedan funcionar en intervalos relativamente 
breves. Sin embargo, hay pruebas de efectos más duraderos. En un estudio muy 
influyente, Milgram (1963) percibió que sus sujetos estudiantes podrían ser 
inducidos a suministrar lo que ellos creían que eran electroshocks de intensidad 
Casi letal a compañeros participantes en un estudio experimental, 
proporcionando la presión social adecuada. En este caso, simplemente fue 
suficiente con pedir a sus estudiantes de Stanford que jugaran el papel de 
carceleros y que controlaran a sus compañeros estudiantes que hacían de 
prisioneros. 


En una versión algo más suave de este paradigma, Bargh et al. (1996, 
Experimento 1) pidieron a sus sujetos que unieran palabras para formar frases. A 
un grupo le dieron frases compuestas por muchas palabras cultas, mientras que 
en el otro grupo las frases fueron más ordinarias. Después de completar esta 
tarea, se pidió a los sujetos que abandonaran la habitación y que contactaran con 
el experimentador, que estaba conversando fuera en el hall. El experimentador se 
aseguraba de que la conversación continuara diez minutos más, o hasta que el 
sujeto la interrumpiera. Mientras que un 63 por ciento de las personas que habían 
sido preparadas con palabras incultas interrumpieron la conversación, solo el 17 
por ciento de las personas preparadas con palabras educadas interrumpieron al 
entrevistador. Un tercer grupo control con palabras neutrales interrumpió el 37 
por ciento de las veces. 


No solo es posible influir en lo que la gente hace facilitando actitudes, también 
es posible influir en la forma en que posteriormente evalúan su conducta, lo que 
a su vez puede influir en tareas posteriores. Bargh y Chartrand (1999) prepararon 
a Sus sujetos con palabras relacionadas con el logro o con palabras neutrales, 
antes de darles una tarea de resolución de anagramas, que fue descrita como una 
actividad simplemente diseñada para rellenar el intervalo posterior. Los 
anagramas podían ser fáciles o difíciles, y a continuación se les daba una tarea 


de apreciación del estado anímico. Solo los sujetos que habían sido preparados 
con palabras relacionadas con el logro se vieron influidos por la tarea de 
resolución de anagramas, y apreciaron tener mejor humor tras haberles dado 
ítems más fáciles. En un estudio posterior, en lugar de la escala sobre el estado 
anímico, se pidió a los sujetos que realizaran los tests verbales del Examen de 
Graduación. Aquellos que habían experimentado las palabras de logro seguidas 
de anagramas fáciles puntuaron más alto. 


13.2.5. ¿Control cultural ? 


Como psicólogo cognitivo, mi respuesta inicial a los descubrimientos de Bargh y 
Ferguson fue de escepticismo. ¿ Sabemos con seguridad que mucha de nuestra 
conducta está controlada conscientemente? No tanto, dicen Bargh y Ferguson, y 
citan evidencias sustanciales que indican que el sentirse agente, la medida en que 
nuestra conducta puede ser atribuida a factores individuales más que 
situacionales, depende fuertemente de la cultura. Vamos a considerar por 
ejemplo un estudio de Latané y Darley (1968), que escogieron a estudiantes de 
teología que tenían que hablar del tema del Buen Samaritano. Sin conocimiento 
por parte de los estudiantes, en vez de formar parte del curso de teología, esto 
formaba parte de un experimento psicológico, en el que el primer componente 
consistía en realizar una tarea diferente y aparentemente independiente, que se 
organizó para más tarde. Cuando los estudiantes corrían para cumplir con su 
tarea asignada, se encontraban con alguien en el camino que parecía estar 
enfermo y necesitaba su ayuda. A pesar de la obvia relación con el tema que 
acababan de tratar, muchos, al igual que el Fariseo, ignoraron la petición de 
ayuda, y pasaron de largo. La presión social de llegar tarde era aparentemente 
más fuerte que actuar sobre una base teológica o ética. 


Aunque esto puede revelar un grado de hipocresía algo impactante a ojos de los 
occidentales, Choi et al. (1999) sugieren que sería menos probable que 
sorprendiera a observadores de una cultura del este asiático, como la coreana. 
Los «occidentales» (en la mayoría de los estudios esto se refiere a estudiantes 
universitarios de EE.UU.), típicamente atribuyen la causa de la acción a la 
persona, y a Su vez a sus cualidades personales, buenas o malas, generosas o 
egoístas, mientras que los estudiantes orientales o sudasiáticos tienen mucho más 


en cuenta las circunstancias que rodean la acción y las interpretan. 


Incluso cuando simplemente se les pide que describan a conocidos, Shweder y 
Bourne (1982) encontraron que los estudiantes estadounidenses les describían en 
términos de rasgos abstractos de personalidad, mientras que los indios 
mencionaban con más probabilidad factores contextuales, como su papel en la 
familia y su ocupación. En un trabajo posterior de Miller (1987) se demostró que 
la tendencia a confiar en descripciones sobre rasgos personales aumentaba en los 
sujetos estadounidenses de los ocho a los quince años de edad, pero no cambiaba 
en los sujetos indios. Cuando Miller (1984) pidió a sus sujetos con edades desde 
los ocho años hasta sujetos adultos que seleccionaran una parte de la conducta a 
través de relaciones que hubieran tenido un buen final y otras que hubieran 
tenido un mal final, los sujetos hindúes interpretaron la situación seleccionada en 
términos del contexto el doble de veces que los sujetos estadounidenses, quienes 
emplearon el doble de explicaciones basadas en rasgos del carácter. Esto ocurrió 
así particularmente en el caso de los malos comportamientos. De nuevo, la 
tendencia de los estadounidenses a usar rasgos del carácter aumentó con la edad. 


La diferencia oriental-occidental se da incluso al interpretar la conducta de un 
pez de dibujos animados. Cuando se pidió que describieran la conducta de un 
pez que se unía o dejaba un banco de peces, los estudiantes estadounidenses 
dieron una explicación en términos del carácter del pez, mientras que los 
estudiantes chinos atribuían la conducta con más probabilidad a factores 
contextuales. El efecto no está limitado a experimentos cuidadosamente 
diseñados: Morris y Peng (1994) analizaron los artículos de dos tragedias 
aparecidas en periódicos estadounidenses de habla inglesa y en periódicos 
chinos; en ambos, un individuo (un estudiante y un trabajador de correos) mata a 
su supervisor y a sus compañeros de trabajo. Mientras que las explicaciones de 
los ingleses acentuaban los factores disposicionales, con frases como «el hombre 
era mentalmente inestable» y «perturbado», el periódico chino acentuó el 
contexto, su fracaso para congeniar con el supervisor, la falta de religión en la 
cultura china y el posible efecto de la oleada de asesinatos en Tejas. 


La diferencia entre culturas permanece incluso cuando el contexto se acentúa. 
Jones y Harris (1967) pidieron a sus sujetos estudiantes que prepararan un 
discurso a favor o en contra de Castro, y que se lo entregaran a otro estudiante 
que debía juzgar las creencias del ponente del discurso. A pesar de haber sido 
informados de las instrucciones que se les había proporcionado a los ponentes, 
los estudiantes americanos tendían a ignorar esta información contextual tan 


crucial, y juzgaron a los ponentes positivos a favor de Castro en mayor grado 
que los estudiantes coreanos con la misma información. Nisbett et al. (2001) 
atribuyeron estas y otras diferencias relacionadas entre la cultura americana y la 
asiática a la analítica visión aristotélica del mundo que poseen los occidentales, 
en contraste con una visión confucionana más holística que poseen los asiáticos. 
Sugieren que una visión acentúa la persona individual y la importancia del 
debate, mientras que la otra acentúa la obligación social y la armonía. 


Aunque esta es una especulación interesante que ofrece una interpretación de las 
dominantes e interesantes diferencias observadas, no tengo muy claro si las 
actitudes contemporáneas de los estudiantes americanos podrían ser 
representativas de los dos últimos milenios de cultura occidental. Sería 
interesante ver si emerge un patrón similar en otras culturas occidentales que 
sean menos individualistas que la americana. Por ejemplo, ¿se comportarían de 
la misma manera los estudiantes escandinavos? ¿Qué ocurriría con personas de 
otro grupo de edad, o influidas por otra religión? Sin embargo, a pesar de la 
interpretación específica que han recibido estos interesantes descubrimientos, 
apoyan la declaración de Bargh de que, dentro de nuestra cultura, el control total 
que tiene el individuo de sus acciones no es de ningún modo universal, y puede 
haberse exagerado enormemente. Dentro del contexto de la memoria de trabajo, 
proporcionan un recordatorio de la importancia potencial de los procesos 
habituales que fácilmente podemos ignorar si acentuamos los procesos de 
control ejecutivo. 


13.3. El sentido de ser agente 


13.3.1. Evidencia fisiológica y la «ilusión del usuario» 


A primera vista, uno de los argumentos en contra de la posición determinista 
propuesta por Bargh y Ferguson es el simple sentimiento de ser agente, de que 
nosotros decidimos cuándo actuar y lo que hacer. El Dr. Johnson dice haber 
respondido a la idea del determinismo golpeando una piedra y declarando «Te 
rebato». ¿Pero acaso este acto aparentemente impredecible es en realidad una 
refutación? Norretranders (1999) ha defendido que no, y que nuestro sentido de 


ser agente es simplemente un engaño producido por nuestro cerebro, algo que él 
denomina «la ilusión del usuario». Norretranders cita como apoyo a su idea un 
estudio de Libet muy discutido (Libet et al. , 1983; Libet, 1985) en el que se 
pedía a los sujetos que de vez en cuando presionaran una palanca, y que dijeran 
en qué momento «decidían» emitir una respuesta. Su respuesta se decidía en 
términos de la posición de las manecillas en un reloj que observaban 
continuamente. Al mismo tiempo se observaba la actividad electrofisiológica del 
córtex motor. Un descubrimiento algo sorprendente fue que la actividad cortical 
comenzaba medio segundo antes de que los sujetos mencionaran su decisión, 
como si la actividad motora causara la decisión, y no al revés. Esta conclusión 
fue muy controvertida (ver los comentarios aparecidos tras el artículo de Libet 
[1985]), pero el fenómeno ha sido ampliamente replicado, tal como veremos más 
abajo. Bargh y Ferguson, empleando esta evidencia para apoyar su argumento 
del determinismo, sugirieron que el resultado de Libet demuestra la forma en 
que la conducta de un sujeto está controlada por las instrucciones del 
experimentador. 


Este tema fue tratado en un estudio de Haggard y Eimer (1999) en el que se 
continuó con el efecto Libet. El paradigma fue esencialmente el mismo que usó 
Libet, con la excepción de que al sujeto le daban dos teclas, una para el dedo 
índice izquierdo y Otra para el derecho. Les pidieron que ellos mismos eligieran 
qué dedo usar en cada ensayo. Haggard y Eimer registraron dos potenciales 
electrofisiológicos distintos, el Potencial de Preparación General que típicamente 
precede a todo movimiento, y el Potencial de Preparación Lateralizado, que está 
asociado con la actividad del área motora suplementaria (AMS) y con la 
selección de movimientos específicos. De nuevo los sujetos observaban un reloj, 
y se les pedía que anotaran en primer lugar «cuando fueran a preparar» un 
movimiento, y después cuando realmente se movieran, usando el dedo izquierdo 
o el derecho. La primera respuesta que se daba era el Potencial de Preparación 
General, asociado con el movimiento en general. A esta le siguió el potencial de 
preparación lateralizado para el dedo izquierdo o derecho junto con un 
componente previo del potencial que se asocia con el informe de preparación, y 
solo después venía seguido de la información verbal acerca de la decisión de 
moverse. Los resultados confirmaron por tanto la observación de Libet de que de 
hecho, el primer signo de movimiento electrofisiológico consciente parece 
ocurrir antes que la intención de moverse, y está claro que aparece antes que el 
movimiento real. 


En otro estudio, Haggard y Magno (1999) de nuevo pidieron a sus sujetos que 


anotaran el momento en que fueran a realizar un movimiento. En algunas 
Ocasiones, su respuesta se asociaría con la estimulación magnética transcortical 
(EMT) mediante la cual se usa un campo magnético para producir una 
interrupción neuronal altamente localizada que puede impedir el funcionamiento 
del área en cuestión durante la estimulación. Esto se aplicaba, bien sobre el 
córtex motor primario, o bien sobre el AMS. En esta ocasión se pidió a los 
sujetos que respondieran tan rápido como pudieran a un estímulo. Cuando la 
EMT se aplicaba al córtex motor primario, que sabemos que está involucrado en 
el control del movimiento, producía una larga demora a la hora de responder 
abiertamente, pero solo tenía un pequeño efecto sobre el tiempo para informar de 
la ejecución de la respuesta. En contraste, la estimulación de la AMS, que se 
asocia con la selección de la respuesta, tuvo poco efecto sobre el tiempo de 
reacción, pero enlenteció marcadamente la respuesta consciente, sugiriendo que 
el estado consciente está asociado con el AMS, en vez de con los procesos 
finales de control de los músculos en la ejecución de una respuesta. 


Parece por tanto que el efecto Libet es replicable, estando la iniciación del 
movimiento asociada sobre todo con el córtex motor primario, mientras que el 
sentimiento de ser consciente parece depender del AMS. La sugerencia de Bargh 
y Ferguson de que la conducta está simplemente controlada por el 
experimentador no parece proporcionar una explicación adecuada. Al sujeto no 
se le dice cuál de las dos respuestas se requiere, ni se le especifica el tiempo 
preciso. ¿Qué es lo que determina entonces la respuesta y cuándo se realiza? El 
efecto Libet es claramente inconsistente con una simple visión realista del 
control de la acción, por la cual primero tiene lugar una decisión consciente y 
luego esto actúa como una cadena de respuestas motoras. La conciencia está 
presente pero no parece ser primaria. 


13.3.2. El papel de la memoria de trabajo 


¿Significa por tanto que la decisión consciente es irrelevante? Desde luego que 
no. Supongamos, por ejemplo, que nadas en una fría piscina. Puedes haberte 
comprometido a tirarte, pero vacilas en el salto, hasta que de pronto te 
encuentras en el agua sin recordar cuándo has tomado la decisión final de tirarte. 
Ser consciente puede ser relevante, pero no es crucial para llevar a cabo el acto. 


Por supuesto, el hecho de que una parte de nuestro comportamiento esté bajo el 
control de los estímulos ambientales no significa que aquí se acabe toda la 
historia. Una evolución algo más imparcial de esta reciente línea de 
investigación en psicología social es la propuesta por Gilbert (2002), que sugiere 
que los juicios son generalmente el producto de sistemas no conscientes que 
operan rápidamente, sobre una base de escasas evidencias y de forma rutinaria, y 
luego llegan sus rápidas aproximaciones a la conciencia, la cual les regula lenta 
y deliberadamente. En resumen, aunque la mayoría de nuestros juicios son 
rápidos y automáticos, están abiertos a la reflexión y a la revisión, un proceso 
que probablemente depende de la memoria de trabajo. 


Gilbert ilustra su opinión citando una hipotética situación en la que un niño, 
Willy, rompe el caro jarrón Ming de su tía. Tal como él señala, la actitud de la tía 
de Willy tras esta acción sería distinta si ella creyera que estaba intentando 
quitarle el polvo y no usándolo como diana para practicar con su tirachinas. Es 
decir, una de las funciones de la conciencia es permitir lo que él denomina 
«corrección inferencial», por la cual un juicio inicial puede modificarse sobre la 
base de información contextual adicional. Como vimos en la discusión sobre las 
diferencias culturales respecto al sentido de ser agente, las diferentes sociedades 
ponen un énfasis distinto sobre las variables contextuales, pero incluso los 
individuos de una cultura que no sea muy sensible al contexto social es probable 
que al menos hagan alguna diferenciación entre dos escenarios posibles de rotura 
del jarrón. Es este último proceso de reflexión el que probablemente dependa 
con más fuerza del almacenamiento y la capacidad ejecutiva de la memoria de 
trabajo. 


Una serie de experimentos de Gilbert y colegas investigaron hasta qué punto 
corregir una impresión inmediata puede depender de recursos cognitivos, uno de 
los sellos distintivos del ejecutivo central. Gilbert et al. (1988) pusieron a sus 
sujetos un vídeo sin audio acerca de una mujer joven que estaba siendo 
entrevistada. Su tarea consistía en juzgar su personalidad, concretamente 
decidiendo si era una persona especialmente ansiosa. Les proporcionaron a los 
sujetos una fuente de ayuda adicional, que consistía en un subtítulo que indicaba 
si estaba siendo entrevistada acerca del embarazoso y estresante tema de las 
fantasías sexuales, o si estaba siendo preguntada por un tema más neutral, como 
viajes por el mundo. Los sujetos recibían información de los temas de la 
entrevista; para un grupo los temas eran todos provocadores de ansiedad, y para 
el otro, todos eran neutrales. Bajo condiciones de línea base estándar, los sujetos 
modificaban sus juicios en función de los subtítulos, generalmente juzgando a la 


señora como menos ansiosa cuando suponían que estaba siendo entrevistada 
acerca de temas embarazosos. Sin embargo, en una segunda condición, los 
sujetos tenían la tarea adicional de seguir el hilo de la conversación y recordar 
los distintos temas. Este grupo recordó con éxito un mayor número de temas en 
un test posterior, pero lo tenían menos en cuenta a la hora de evaluar la 
personalidad del entrevistado. Claramente poseían la información atenuante, 
pero eran menos proclives a usarla, presumiblemente porque dirigían su atención 
a la tarea de memoria en lugar de usar la información suplementaria para 
interpretar el vídeo. 


En otro estudio, Gilbert et al. (1992) demostraron que degradando la calidad de 
la cinta, y dificultando así la tarea, también disminuía la medida en que los 
sujetos tenían en cuenta la información atenuante. Sin embargo, en lugar de 
emitir el juicio inmediatamente se les daba unos instantes de reflexión, entonces 
la información atenuante sí se tomaba en cuenta, dando lugar a un juicio sobre la 
joven entrevistada más sensible contextualmente. Esto sugería que el fracaso a la 
hora de tener en cuenta las circunstancias atenuantes provenía de una falta de 
capacidad para combinar la información relevante, y no de un procesamiento 
inicial inadecuado. En un estudio posterior, Gilbert y Gill (2000) mostraron que 
la autovaloración de los sujetos acerca de su propia personalidad podía verse 
influida por la música de fondo, siempre que tuvieran que responder bajo la 
presión del tiempo, un efecto que desaparecía cuando se les daba tiempo para 
reflexionar, sugiriendo de nuevo que aunque puede que estemos 
automáticamente influidos por indicios ambientales, cuando el ejecutivo central 
está sobrecargado, esto no excluye el importante papel de la memoria de trabajo 
bajo condiciones menos exigentes. 


Gilbert (2000) mostró efectos similares acerca de la capacidad limitada del 
sistema ejecutivo en una tarea en la que el sujeto clasifica una nueva frase como 
verdadera o falsa. Como él mismo señala, esto se relaciona con la discrepancia 
filosófica clásica entre Descartes y Spinoza, relacionada con la naturaleza del 
entendimiento y su relación con las creencias. Descartes propone un proceso 
secuencial mediante el cual, primero se comprende una frase, y solo después se 
decide, en función de las evidencias, si es verdadera o falsa. En contraste, 
Spinoza sugiere que solo cuando comprendemos algo lo creemos 
implícitamente, y solo posteriormente corregimos nuestra creencia si la 
evidencia nos indica un error. Si Spinoza estaba en lo correcto, entonces reducir 
los recursos atencionales obstaculizaría estos procesos de corrección finales, 
dando lugar a un sesgo a la hora de aceptar un hecho como verdadero bajo la 


presión del tiempo. Esto es lo que Gilbert (2002) observó. 


Tal como Gilbert apuntó, tendemos a tener un sesgo positivo al juzgar el mundo, 
y como Wason y Johnson Laird (1972) observaron, cuando buscamos 
información sobre el mundo o ponemos a prueba nuestras hipótesis como 
científicos, tendemos a fijarnos en la confirmación de nuestros supuestos, en vez 
de perseguir una estrategia más eficiente que consiste en poner a prueba toda 
evidencia en contra. En promedio, es probable que esta sea una estrategia 
práctica, en un mundo en el que nuestras creencias sobre su funcionamiento son 
normalmente correctas. Sin embargo, nos hace potencialmente vulnerables a las 
manipulaciones de los publicistas y de los políticos, a menos que estemos 
preparados para usar nuestros procesos ejecutivos atencionalmente demandantes 
para evaluar estos mensajes. Suponed, entonces, que asumimos cierta forma de 
control ejecutivo sobre nuestra visión del mundo y de nuestras acciones sobre él, 
¿cómo funcionaría un sistema como este? 


13.4. Memoria de trabajo y autocontrol 


La sección que sigue a continuación refleja mi idea de que el autocontrol es una 
función importante de la memoria de trabajo, y en particular del ejecutivo 
central. Mientras que los psicólogos cognitivos están empezando a estudiar los 
mecanismos de control, por ejemplo, a través del análisis de los efectos 
inhibitorios, como discutimos en el capítulo previo, este es un progreso 
relativamente reciente. Sin embargo, el tema del autocontrol ha sido investigado 
por los psicólogos sociales desde hace 20 años. La siguiente sección describe 
una parte de esta investigación. 


13.4.1. Un modelo de bucle de retroalimentación del autocontrol 


Carver y Scheier (1981) propusieron un modelo de autocontrol que se parece al 
modelo TOTE ( Test-Operate-Test-Exit) propuesto por Miller et al. (1960). El 
modelo asume una serie de estándares que deben alcanzarse, compuestos por 


objetivos, ideales y una serie de operaciones o procesos a través de los cuales se 
podrían alcanzar esos objetivos. Los resultados de estas operaciones se controlan 
para ver hasta qué punto se aproximan a los estándares relevantes. El fallo de 
autocontrol puede deberse a un déficit en cualquiera de estas etapas. La primera 
etapa puede fallar porque la persona tenga objetivos incompatibles, o 
posiblemente objetivos inapropiadamente ambiciosos. Como hemos visto, el 
proceso de control implicado en la segunda fase requiere atención, y puede verse 
interrumpido por la distracción, o por otro factor como la influencia del alcohol. 
En tercer lugar, el control puede perderse a un nivel operativo. Una persona 
hambrienta que sigue una dieta puede ser incapaz de resistirse ante una 
chisporroteante y jugosa hamburguesa haciéndose en la parrilla frente a él. El 
fallo a este nivel implica un cierto tipo de concepto de fortaleza, no muy distinta 
al concepto de fuerza de voluntad. 


Baumeister y Heatherton (1996) usan este modelo como base para su análisis del 
importante tema sobre el fallo de autocontrol. Como ellos señalan, una gran 
cantidad de problemas sociales pueden ser considerados como consecuencia de 
la pérdida de autocontrol. Entre algunos ejemplos obvios se incluyen el 
alcoholismo, la drogadicción, la obesidad, el tabaquismo y la ludopatía. La 
comprensión de los procesos implicados en el autocontrol, así como su fallo, es 
de una importancia práctica enorme. Baumeister y Heatherton clasifican su 
revisión en casos en los que el comportamiento está infrarregulado y aquellos en 
los que está mal regulado. 


13.4.2, Fallo de control debido a una infrarregulación 


Una categoría dentro de los fallos de regulación proviene de la simple inercia, 
por la cual dejamos que continúe un hábito existente. Dentro del modelo de 
Norman y Shallice (1986), esto es equivalente a una situación en la que un 
esquema existente o un hábito supera la intención a largo plazo, que funciona a 
través del SAS, como, por ejemplo, al seguir la ruta habitual de camino a la 
oficina un sábado por la mañana, giras equivocadamente cuando en realidad te 
diriges a hacer la compra. La simple inercia es probablemente una de las fuentes 
más comunes de los lapsus de control. Muchos fumadores, por ejemplo, aunque 
están completamente alertados del posible riesgo físico a largo plazo, por no 


mencionar el coste económico a corto plazo, siguen persistiendo en su hábito. La 
otra cara de esta particular moneda es lo que Baumeister y Heatherton se refieren 
como «transcendencia», un feliz estado por el que el atractivo de los objetivos a 
corto plazo, como el placer del primer cigarro matutino, se ve invalidado o 
transcendido por el objetivo a largo plazo de seguir vivo y sano. Se supone que 
esto refleja el exitoso funcionamiento del SAS, o en términos de la memoria de 
trabajo, el ejecutivo central. Dentro del modelo de Norman y Shallice, el tercer 
miembro de esta trinidad, que ellos denominan aquiescencia, aparece cuando la 
fuerza de la transcendencia, tal como refleja el ejecutivo central, pierde 
momentáneamente su poder para controlar la conducta. Esta situación se discute 
con más detalle en la sección acerca del anhelo que se trata en el Capítulo 14. 


Como señalan, existen dos formas de conceptualizar esta caída en desgracia: 
como un impulso irresistible o como un lapsus momentáneo. Considerándolo 
más de cerca, ellos sugieren que la teoría del impulso irresistible no parece una 
explicación del todo convincente. Incluso algo tan simple como fumar un cigarro 
requiere encontrar un momento y lugar adecuados, algo no siempre fácil hoy en 
día. No es, como ellos señalan, una cuestión de «simplemente relajarse, volverse 
pasivo y dejar que las cosas sucedan». Marlatt y Gordon (1985) citan el caso de 
un jugador compulsivo que discutió con su mujer justo antes de un viaje de 
negocios desde San Francisco a Seattle. En lugar de conducir por el norte hacia 
Seattle, decidió coger una ruta panorámica atravesando la ciudad del casino de 
Reno (hacia el este), donde paró y aparcó. Como necesitaba dinero para el 
parquímetro, se acercó al edificio más cercano, que resultó ser el casino. 
Después de prometerse hacer una sola apuesta para probar suerte, apareció unos 
tres días después. Este episodio representa claramente algo más que un único 
lapsus breve, y quizá pueda considerarse mejor como una serie de lapsus 
cometidos bajo una presión sostenida y a partir de un poderoso impulso. 
Probablemente no tuviera la intención deliberada de jugar en ningún momento, 
pero tampoco podríamos considerar que fuera una víctima pasiva. Parece como 
si costara autocontrolarse bajo estas circunstancias, y muy a menudo parece 
como si una vez que el lapsus ha tenido lugar hubiera una tendencia a abandonar 
cualquier otra restricción, lo que en este caso dio lugar a tres días de apuestas en 
el casino. 


La violencia personal suele seguir un patrón similar, en el que la frustración y la 
ira crecen hasta dar paso a la violencia, una situación que a menudo se ve 
exacerbada por la capacidad del alcohol para reducir el grado de autocontrol. 
Esta parece ser la evidencia más convincente para la interpretación del impulso 


irresistible; de hecho se usa frecuentemente como circunstancias atenuantes en 
los juicios. Incluso aquí, sin embargo, lo considerado como irresistible parece 
depender de las normas sociales. Bing (1991) dice que ciertos insultos entre 
bandas urbanas juveniles son generalmente aceptados como una justificación 
para iniciar una pelea, mientras que otros no. La tasa de homicidios es mayor en 
América del Sur que en ningún otro lugar, pero solo tras discusiones (Nisbett, 
1993), ¡un buen dato para el turista! El crimen por «ataque de locura», en el que 
un hombre pierde el autocontrol, ataca y mata a personas inocentes fue 
considerado tradicionalmente en Malaysia como resultado comprensible del 
impulso irresistible que origina el estrés, pero cuando la ley británica fue menos 
indulgente e impuso duras penas, a pesar de lo irresistible, su incidencia declinó 
rápidamente (Carr y Tan, 1976). 


Berkowitz (1978) alcanzó una conclusión similar acerca de la resistencia de los 
impulsos irresistibles a partir de su estudio con criminales violentos británicos. 
Él describe, por ejemplo, el caso de un marido que pegó al amante de su mujer 
con sus puños, rompió una botella y, al darse cuenta de que si la usaba podía 
matar al hombre, la dejó a un lado para seguir pegándole. En general, por tanto, 
parece probable que aunque haya poderosos motivos que puedan dar lugar a los 
lapsus de control que luego se van sucediendo, el caso de lo irresistible no es, a 
pesar de su popularidad entre los abogados defensores, tan irresistible. 


13.4.3. Diferencias individuales en el autocontrol 


Hay muchos casos de asociaciones positivas entre la estimación del autocontrol 
y adaptación social. Por ejemplo, Maszk et al. (1999) encontraron que los niños 
evaluados con un buen autocontrol tenían un estatus social más alto y eran más 
populares entre sus compañeros. Estudios longitudinales han demostrado que 
una valoración del autocontrol baja está asociada con una tendencia posterior a 
la delincuencia (Pulkkinen y Hamalainen, 1995). Gottfredson y Hirschi (1990) 
defendieron que un pobre autocontrol es el causante de la mayor parte de la 
conducta antisocial y de la agresión en adultos, una conclusión apoyada por 
Avakame (1998). 


13.4,4, Autoinformes de control 


Muchos cuestionarios de autoinformes contienen subescalas que pretenden 
medir el autocontrol. En un estudio con cuestionarios de Gramzow et al. (2000), 
se estudiaron factores fuertemente asociados con el estrés emocional. 
Encontraron que medidas de autocontrol, fuerza del ego y «resistencia» estaban 
fuertemente asociadas con el estrés emocional. Otros aspectos del yo, como la 
autoconsistencia O la autoestima, medida a través de la discrepancia entre el yo 
real y el yo ideal, estaban menos estrechamente asociadas con la estabilidad 
emocional. 


Tangney et al. (2004), animados por todo esto, desarrollaron un cuestionario 
compuesto por 36 ítems, o por 13 en su versión abreviada. Los sujetos 
simplemente tenían que marcar una serie de frases sobre ellos mismos como 
verdaderas o falsas, por ejemplo: 


Soy un vago. 
Rechazo las cosas que son malas para mí. 
A menudo actúo sin pensar. 


No me desanimo fácilmente. 


En su estudio inicial recopilaron datos de 350 estudiantes, quienes a su vez 
completaron una serie de medidas, incluyendo medidas de deseabilidad social, la 
medida en que el sujeto desea complacer a los demás. Las correlaciones entre la 
deseabilidad social y su medida de autocontrol variaron de 0.54 a 0.60. Aunque 
no es intrínsecamente imposible que las personas con un buen autocontrol en 
términos generales también tiendan a preferir ser aceptados por los demás, esto 
presenta un claro problema de interpretación, ya que la deseabilidad social 
simplemente puede reflejar la tendencia de la gente a dar las respuestas a las 
preguntas del autocontrol que ellos crean que serán aprobadas por el 
experimentador. Por esta razón, Tangney et al. usaron el análisis de covarianza 


para controlar la deseabilidad social antes de arrojar las conclusiones descritas 
más abajo en relación a otras correlaciones. 


En general, la escala posee buenas cualidades de fiabilidad, incluso cuando se 
redujo a 13 ítems. Su validez se evaluó asociándose con otras medidas. Esto 
indicó que los individuos que se valoraron a sí mismos con un alto autocontrol 
era menos probable que informaran de desórdenes alimentarios o de problemas 
de alcohol como emborracharse como una cuba. Los participantes también 
hacían un test de personalidad que evaluaba los conocidos cinco factores de 
personalidad, los «big five». Después de introducir la deseabilidad social como 
covarianza, el autocontrol se asoció con la concienciación, la estabilidad 
emocional, las relaciones personales positivas y con relaciones familiares de 
apoyo y no conflictivas. Finalmente, los que puntuaron alto tendían a tener una 
nota media final mayor que los que puntuaron bajo. 


Aunque los descubrimientos de Tangney et al. son muy alentadores y sugieren 
que esta línea de investigación vale la pena, el hecho de que todas las medidas 
estén basadas en autoinformes limita el peso que uno desearía poner sobre los 
tests en este punto. Afortunadamente, es una medida muy corta y conveniente, 
sobre la cual se están empezando a acumular datos procedentes de otros 
laboratorios. Los supervisores que puntúan alto en medidas de autocontrol son 
juzgados por sus subordinados como personas de fiar (Cox, 2000). Engels et al. 
(2000) observaron que los que puntúan alto tienden menos a la delincuencia 
juvenil y al abuso del alcohol, mientras que Finkel y Campbell (2001) también 
encontraron que los que puntúan alto tienen relaciones interpersonales mejores. 
Un punto final tratado por Tangney et al. es la cuestión de si la relación entre el 
autocontrol y la adaptación social es lineal, o si un autocontrol excesivo puede 
dar lugar a una mala adaptación, como en el caso del maniático del control. No 
encontraron evidencias de esto en su propio estudio, aunque claramente este 
tema necesita ser explorado más ampliamente. 


En conclusión, aunque mucha de la evidencia está basada en autoinformes o 
valoraciones, parecen existir razones de sentido común convincentes de que la 
gente difiere en el grado de autocontrol. La evidencia actual disponible sugiere 
que el autocontrol es un rasgo muy positivo, y bien puede reflejar el 
funcionamiento de un proceso de control cognitivo de sustancial importancia 
teórica y práctica. 


13.4.5. Autocontrol: la analogía del músculo 


Suponed que aceptamos que la gente difiere en su capacidad de autocontrol: 
¿Cuál sería el mecanismo que subyace a esta variación individual? Muraven y 
Baumeister (2000) sugieren que la capacidad de autocontrol tiene mucho en 
común con la forma en que funcionan los músculos, acentuando implícitamente 
por tanto el aspecto energético, y no el control, de la forma en que la acción está 
gobernada. Ellos sugieren que esta capacidad refleja la fase «funcional» de un 
sistema de control, en vez de otros componentes, como fijar objetivos o 
monitorizar. Realizan tres supuestos: el primero, que el autocontrol tiene 
recursos limitados, y el segundo, que existe un límite respecto al número de 
conductas que se pueden controlar a un mismo tiempo. Ambos se podrían aplicar 
igual de bien a un sistema que tuviera una información limitada, dependiendo 
por ejemplo de la capacidad atencional. Este no es el caso, sugieren ellos, del 
tercer supuesto, según el cual el sistema tiene efectos secundarios que dan lugar 
a la extenuación, de forma análoga al debilitamiento de los músculos. 
Asumieron, además, que esto es específico de tareas que implican una necesidad 
de mantener la acción a pesar de las tentaciones que se den a corto plazo. Se 
supone que estas tentaciones reflejan una deseabilidad. Por tanto, lo que es 
crucial es el carácter hedónico de la situación, y no la dificultad general de las 
tareas implicadas. Finalmente, ellos observaron que es posible construir una 
capacidad de autocontrol, de la misma manera que se fortalece un músculo. 
Muraven y Baumeister presentan pruebas de cada uno de estos supuestos. 


13.4.6. Debilitamiento de la fuerza 


Muraven et al. (1998) describen estudios en los que los sujetos realizaban dos 
tareas consecutivas. Cuando ambas tareas implicaban autocontrol, la segunda se 
realizaba peor que si hubieran sido distintas. Por ejemplo, los sujetos veían un 
emocionante vídeo durante el cual tenían que suprimir cualquier tipo de 
respuesta visible o audible. Después pasaban a otro estudio aparentemente 
distinto en el que tenían que agarrar un mango tan fuerte como pudieran y todo 
el tiempo que pudieran. Los sujetos a los que se les había pedido que 


suprimieran todo tipo respuesta emocional en el vídeo, fueron menos 
persistentes agarrando el mango — se les cansaba la mano- que los sujetos 
control. Este efecto no fue simplemente un efecto del estado anímico; tanto si el 
vídeo era triste y angustioso, como alegre y divertido, las supresiones previas 
impedían mantener agarrado el mango. En otro estudio se pidió a los sujetos que 
evitaran pensar sobre un tema concreto, como por ejemplo un osito de peluche 
blanco, algo que Wegner (1994) había demostrado que es difícil de conseguir. 
De nuevo, esto redujo la persistencia sobre una tarea posterior no relacionada, 
que consistía en resolver puzles que en realidad eran irresolubles. 


Los efectos negativos tras estresores ambientales también podrían debilitar la 
capacidad de autocontrol. Los sujetos expuestos a ruidos bruscos tenían un 
rendimiento menos bueno en una tarea de lectura posterior llevada a cabo en 
condiciones silenciosas. Los sujetos expuestos a ruidos demostraron tener una 
menor tolerancia a la frustración. Sin embargo, cuando les proporcionaban un 
botón que les permitía silenciar el ruido si era necesario, el efecto se reducía, 
incluso cuando los sujetos no decidieran presionar el botón (Glass et al. , 1969). 
La falta de control tiende a inducir lo que Seligman ha denominado «indefensión 
aprendida», por la cual el sujeto se vuelve pasivo, como si renunciara al control 
(Seligman, 1975; Hiroto y Seligman, 1975). Otros estresores poseen efectos 
similares: por ejemplo, Sherrod (1974) estudió los efectos del hacinamiento en 
estudiantes femeninas de colegios mayores. Un grupo de ocho estudiantes tenían 
que esperar en una sala pequeña o en una grande, antes de intentar resolver una 
serie de puzles imposibles. El hacinamiento redujo la persistencia en la 
resolución del puzle. Rotton (1983) demostró que la exposición a un hedor 
nauseabundo tenía un efecto similar sobre el rendimiento. 


Sin embargo, aunque estos efectos secundarios del estrés aparecen claramente, y 
son consistentes con la analogía del músculo fatigado, parece igualmente posible 
suponer que la exposición al impredecible ruido de Glass et al. y al mal olor de 
Rotton, simplemente pueda haber disipado toda buena voluntad al servicio de los 
experimentos psicológicos, en vez de debilitar la fuerza de voluntad del 
participante en general. Aun cuando los estudios a menudo llegan a extremos 
para asegurarse de que los dos componentes del experimento están separados, 
mediante tests llevados a cabo por personas diferentes, es probable que ambos 
repercutan en el carácter general de los psicólogos, y su empeño en hacer 
descabelladas peticiones a sus voluntariosos sujetos. Por tanto, los sujetos 
simplemente estarían dejando de tomar parte del contrato implícito entre 
experimentador y participante. 


Este abandono de la hipótesis de la buena voluntad es difícil de poner a prueba, 
pero fue tratada por Schmeichel et al. (2003). Ellos sugieren que el 
debilitamiento del ego, la fatiga de los procesos que subyacen al autocontrol, 
solo influiría en las tareas cognitivas que le suponen fuertes demandas ejecutivas 
al sujeto. Describen dos experimentos en los que se contrastan tareas que 
supuestamente son ejecutivamente exigentes y otras que supuestamente no lo 
son tanto. En un estudio se mostraba a los sujetos una emotiva película y se les 
dejaba libertad para responder, o bien se les pedía que suprimieran toda emoción. 
A continuación, realizaban dos tareas, ambas de naturaleza intelectual. Una 
prueba, el Test de Evaluación de Competencias, se desarrolló para medir 
procesos ejecutivos en pacientes, y requiere que el sujeto use una combinación 
de conocimiento general y de habilidades de resolución de problemas, para 
alcanzar respuestas aproximadas a cuestiones originales como: «¿Cuánto tiempo 
llevaría planchar una camiseta?», o «¿cuántas semillas encontrarías en una 
sandía?». El segundo fue un test de inteligencia cristalizada, como la que se 
necesita para realizar un test de vocabulario, o para responder a preguntas como: 
«¿Qué ciudad se conoce como la Ciudad del Viento?» Aunque ambas tareas 
probablemente correlacionen con la inteligencia, solo la primera exige la 
aplicación activa de procesos ejecutivos. Ellos tan solo encontraron diferencias 
significativas entre los dos grupos en el test de evaluación de competencias, 
encontrando que aquellos que habían suprimido toda emoción rendían peor. Las 
medidas de emoción autoinformada en el momento del segundo test no 
mostraron diferencias entre los grupos. 


Schmeichel et al. interpretaron sus resultados en términos de un debilitamiento 
del ego, según el cual se reduce la capacidad o la voluntad del sujeto para 
iniciarse en un procesamiento cognitivo activo, al mismo tiempo que su efecto es 
mucho menor sobre procesos más automáticos, concluyendo: 


Cuando el yo es debilitado por esfuerzos reguladores previos, un conjunto de 
procesos mentales se deteriora, pero otro conjunto no queda afectado. En 
términos del modelo de MT de Baddeley (1986, 1996), el debilitamiento del ego 
dificulta el control del funcionamiento del ejecutivo central. 


(Schmeichel et al. , 2003, p. 43). 


Siguen señalando que, aunque la complejidad de la tarea y la demanda ejecutiva 
es un factor que influye en la sensibilidad del debilitamiento del ego, no es 
necesario que estas demandas sean primariamente cognitivas. Claros efectos del 
debilitamiento del ego se han detectado sobre tareas tan simples como apretar 
continuamente un dinamómetro de mano (Baumeister et al. , 1998). Puede que 
esta tarea no sea cognitivamente demandante, pero sí implica un control de la 
conducta que se debe mantener en competición con otras acciones más 
atractivas, como liberar el asa cuando empiezas a estar fatigado. Schmeichel et 
al. defienden, creo que de forma convincente, que sus resultados no se pueden 
atribuir a cambios en la emoción, y sugieren que una interpretación motivacional 
es inconsistente con la diferencia entre los dos tipos de tareas, y con la falta de 
cualquier efecto del orden en el que las dos tareas contrastadas fueron realizadas 
por los sujetos. No me convence el hecho de que Baumeister ya haya descartado 
interpretaciones basadas en los cambios de motivación en vez de en el 
debilitamiento del ego per se. Por ello, aunque creo que este estudio empieza a 
tratar la importante pero difícil cuestión de la motivación, probablemente se 
necesita más investigación antes de que el tema quede concluido. 


Sin embargo, parece haber evidencias a favor de una serie de estudios en este 
campo, donde el resentimiento hacia un experimentador indiferente y exigente 
no proporciona una explicación convincente. En muchas situaciones de la vida 
real, un período de estrés causa un deterioro en la capacidad para mantener el 
autocontrol, si lo medimos por las recaídas que sufren las personas que están 
intentando dejar hábitos indeseables como fumar (Cohen y Lichtenstein, 1990), 
la adicción a la heroína (Marlatt y Gordon, 1980), la bebida en los alcohólicos 
(Hodgins et al. , 1995), e incluso en bebedores sociales, quienes tendieron a 
beber más tras un período en el que se les pidió que suprimieran los 
pensamientos (Muraven, Collins y Nienhaus, 1999a). 


13.4.7. Regulación del estado anímico 


Muraven y Baumeister sugieren que intentar mantener una actitud positiva 
también puede suponer una gran demanda para el autocontrol, particularmente 
cuando sucesos externos lo dificulten. Por ejemplo, es más probable que te saltes 
la dieta cuando estás de mal humor (Greeno y Wing, 1994). En un estudio sobre 


alimentación de Baucon y Aiken (1981), sujetos a dieta y sujetos que no estaban 
a dieta participaron en un experimento que comenzaba con un puzle. Un fallo en 
el puzle causaba que los sujetos a dieta comieran más cuando luego tenían la 
oportunidad, mientras que se dio el efecto exactamente contrario en los sujetos 
que no estaban a dieta. Esta interacción descarta la simple interpretación basada 
en una unión entre frustración y apetito. 


13.4.8. Descenso de la vigilancia 


Muraven y Baumeister relacionan su concepto con el descenso del rendimiento 
que aparece en las clásicas tareas de vigilancia en las que los sujetos tienen que 
sostener la atención durante un período de tiempo. Consistente con este enfoque 
es la observación de que, dado un nivel apropiado de expectación inicial 
(Colquhoun y Baddeley, 1964), simples tareas de detección perceptiva no 
muestran el clásico descenso del rendimiento a lo largo del tiempo. El descenso 
aparece sin embargo cuando el sujeto necesita mantener cada estímulo en la 
memoria de trabajo y compararlo con el siguiente ítem, por ejemplo, decidiendo 
si dos estímulos visuales sucesivos son iguales en longitud (Davies y 
Parasuranam, 1982; Parasuranam 1984). Este efecto es particularmente marcado 
en pacientes que sufren la enfermedad de Alzheimer, que muestran déficits 
ejecutivos, pero tienden a mostrar una atención sostenida relativamente buena 
(Baddeley et al. , 1999; Perry et al., 2000), y en niños diagnosticados con 
trastorno de atención con hiperactividad (TDAH), el cual supuestamente refleja 
un autocontrol pobre (Barkley, 1977a; b). 


13.4.9. Efectos del entrenamiento 


Muraven et al. (1999b) impusieron a sus sujetos voluntarios un régimen de dos 
semanas de entrenamiento en autocontrol. Un grupo intentaba mejorar la 
postura, otro la regulación del estado anímico y un tercero intentaba la tediosa 
tarea de mantener un régimen alimentario. Al final de las dos semanas, los 
sujetos control y los sujetos entrenados fueron comparados en una tarea de 


persistencia que consistía en agarrar una empuñadura. Los sujetos que habían 
participado en algún programa de entrenamiento asieron la empuñadura durante 
un promedio de tiempo mayor. Aunque esto es consistente con la analogía 
muscular del autocontrol, como Muraven et al. , afirman, hay otras 
interpretaciones posibles. Entre ellas se incluye la acentuación de la 
autoconfianza, o posiblemente un sentimiento más fuerte de compromiso con el 
medio académico, posiblemente relacionado con la evitación de la disonancia 
cognitiva: «He puesto todo mi esfuerzo en hacer lo que me piden, luego debe ser 
algo bueno» (Festinger, 1957). 


Sin embargo, hay amplias evidencias de apoyo en estudios de entrenamiento 
atencional en pacientes neuropsicológicos, en los que practicar tareas que 
implican autocontrol parece aumentar la capacidad del paciente para realizar 
otras tareas exigentes que no están relacionadas con aquellas que se practicaron 
(Ball et al. , 2002; Klingberg et al. , 2005). Esto contrasta con el ejercicio de la 
práctica para otros déficits cognitivos, como la memoria, en los que hay pocas 
evidencias de que el ejercicio mnemónico mejore el rendimiento en memoria 
(Cicerone et al. , 2005). 


13.4.10. Explicaciones alternativas 


La analogía del músculo parece haber sido de utilidad generando experimentos 
que investigan la naturaleza del autocontrol. Sin embargo, otras hipótesis 
alternativas parecen posibles en muchos de estos estudios. Muraven y 
Baumeister consideran algunas de estas hipótesis, por ejemplo, la posibilidad de 
que las tareas que demandan autocontrol incidan en el estado anímico del sujeto, 
y a su vez influyan en el rendimiento posterior. Señalan que una serie de estudios 
han incluido estimaciones del estado de ánimo (Glass y Singer, 1972; Green y 
Rogers, 1995; Muraven et al. , 1998), y no han encontrado diferencias entre los 
grupos de alta y baja demanda, al menos existe un estudio que incluso ha 
intentado usar autoinformes y medidas fisiológicas, y ninguna de las dos 
medidas ha detectado ningún efecto (Spacapan y Cohen, 1983). 


Para los psicólogos cognitivos, más acostumbrados a los conceptos de 
información y control que a los de energía y esfuerzo, la interpretación más 


obvia se daría en términos de atención reducida en vez de un autocontrol 
debilitado. Dado que el autocontrol a menudo tendría efectos sobre una mayor 
capacidad o voluntad para sostener la atención, separar estas interpretaciones no 
sería fácil. De hecho, el verdadero concepto de atención sostenida frente a la 
distracción parece demandar cierta explicación adicional. Por el momento, todas 
nuestras discusiones del ejecutivo central han estado relacionadas con la forma 
en que se controla la conducta, por qué elegimos una acción en lugar de otra y 
cómo se modula posteriormente esa acción. Sin embargo, lo que nos queda es la 
cuestión crucial sobre por qué nos comportamos al fin y al cabo. ¿Qué es lo que 
está controlado? Claramente necesitamos un apoyo para las explicaciones acerca 
del control, que confían puramente en una especificación del flujo de 
información dentro de un sistema, introduciendo conceptos basados en la energía 
para cumplir con el papel representado en sistemas teóricos anteriores a través de 
ideas como la energía mental (Freud, 1904), el impulso (Hull, 1943) y el arousal 
(Broadbent, 1958; Kahneman, 1973). Un importante enfoque a este problema es 
el estudio de la emoción y su impacto sobre la cognición. Esto constituye el tema 
de los próximos dos capítulos. 


13.5. Conclusiones 


En este capítulo he intentado ilustrar tres áreas en las que el estudio de la 
memoria de trabajo podría beneficiarse de la investigación en psicología social. 
La primera tiene que ver con la medida en que el pensamiento y la acción están 
implícitamente controlados, donde el trabajo de Bargh y colegas es 
particularmente relevante respecto al papel que juegan los esquemas y los 
hábitos en el modelo de control ejecutivo de Norman y Shallice (1986). El 
segundo se relaciona con la manera en que la conducta social refleja el sistema 
atencional supervisor limitado atencionalmente dentro de este modelo, siendo 
particularmente relevante el trabajo de Gilbert y Baumeister. El tercer punto 
tiene que ver con la clara necesidad de un concepto de energía o impulso, dentro 
de la psicología cognitiva, una necesidad que discutiremos más adelante en 
capítulos posteriores. 


El lector habrá notado, sin embargo, que este capítulo no contiene investigación 
directamente relacionada con la memoria de trabajo. ¿A qué puede deberse esto, 


si es que la unión es tan importante? Desde mi punto de vista la respuesta es 
cultural. El enfoque experimental aplicado de la memoria de trabajo ha sido más 
fuerte en Reino Unido, donde la tradición de la psicología social se ha centrado 
en un nivel grupal, tendiendo a rechazar el enfoque experimental 
norteamericano, relacionado más estrechamente con la psicología cognitiva. Si 
este capítulo ha conseguido acercar ciertas posturas mínimamente, entonces 
habrá cumplido su objetivo. 


CAPÍTULO 14 


Memoria de trabajo y emoción l 


Miedo y anhelo 


Durante los primeros años del último siglo se creía que la psicología estaba 
compuesta por tres áreas relacionadas pero distintas —la psicología cognitiva, 
oréctica y conativa—. La oréctica era el término usado para designar el estudio de 
la emoción, mientras que el término de psicología conativa se usaba para el 
estudio de la voluntad. En la segunda mitad del siglo, dentro de la psicología 
experimental humana predominaba la psicología cognitiva, basada en el 
desarrollo de la metáfora del procesamiento de la información, cuyo énfasis en el 
control eclipsó el tema igualmente importante de la motivación, ¿por qué 
hacemos una cosa en lugar de otra? De hecho, ¿por qué hacemos cualquier cosa? 


Sospecho que este descuido proviene en su mayor parte de la dificultad para 
estudiar la emoción y la voluntad dentro de un laboratorio. Ha habido, por 
ejemplo, una falta de investigación acerca de las bases neurobiológicas de la 
emoción, la cual, hasta hace poco, se basaba en los estudios con animales, y 
sigue siendo extremadamente productiva (ver, por ejemplo, LeDoux [1996] y 
Panksepp [1998]). Sin embargo, este trabajo está más allá de mis extralimitados 
propósitos, y de mis competencias. En su lugar, propongo concentrarnos en 
aquello que parece ser claramente relevante para el modelo multicomponente de 
la MT, centrándonos en dos emociones de una relevancia clínica obvia, 
concretamente la ansiedad y la depresión, y limitarnos a cubrir el trabajo con 
humanos. Esto aún deja una extensa y diversa literatura. Por esta razón, como en 
la primera parte del libro, mi revisión se guiará (¿o se verá desencaminada?) por 
mi propia experiencia e intereses. Mis intereses se reflejan en una temprana 
preocupación acerca del rendimiento en circunstancias peligrosas, que proviene 
de mi implicación en una investigación sobre buceo en mar abierto, junto con un 
interés mucho mayor por la unión entre cognición y emoción a través del estudio 
de pacientes con problemas emocionales. Me impliqué en esto de forma 
indirecta, a través de la formación de un grupo de psicólogos clínicos orientados 


a la investigación dentro de mi Unidad en Cambridge. Su éxito uniendo la 
psicología clínica y la cognitiva se ilustra en la revista que ellos fundaron, 
Cognición y Emoción, así como en las dos ediciones del que creo que ha sido un 
libro altamente influyente, Psicología Cognitiva y Trastornos Emocionales 
(Williams et al. , 1988; Williams et al. , 1997). Mi propio punto de vista se ha 
visto fuertemente influido, como se observará, por el de mis excolegas, y aunque 
he intentado tomar una perspectiva equilibrada al escribir los próximos dos 
capítulos, dándole un gran peso a los trabajos posteriores y a otros teóricos, 
sospecho que sería insensato suponer que lo he conseguido por completo. 


Debería comenzar por una definición. Aunque acepto la distinción entre 
emoción como estado fisiológico y como estado psicológico, a diferencia de 
LeDoux (1996), yo no sugiero usar su término «sentimientos» para el estado 
psicológico. En su lugar, también uso el término emoción para los estados 
psicológicos, debido a su gran uso. En las pocas ocasiones en que discuta los 
aspectos fisiológicos de la emoción, intentaré asegurarme de que no haya 
ambigiedad. En línea con el desarrollo de mis propios intereses empezaré 
discutiendo el efecto que tienen las emociones relativamente extremas sobre la 
cognición. 


14.1. Cognición y emoción límite 


Es obvio que pensar con calma de forma persistente y coherente mientras que se 
experimenta una emoción extrema es difícil, de ahí las expresiones como «estar 
fuera de sí por la rabia» o «estar fuera de tus casillas». Una buena explicación 
del impacto de la emoción extrema sobre el pensamiento es la que proporciona 
Philip Roth al describir su reacción cuando descubrió que su padre de 86 años 
tenía un tumor cerebral en estado avanzado. Aunque la cirugía era posible, era 
probable que causara mayor dolor y sufrimiento, aunque no hacer nada 
simplemente significaba esperar a que su padre se fuera deteriorando cada vez 
más. «No puedo leer. Dios sabe que tampoco puedo escribir, ni siquiera puedo 
ver un estúpido partido de béisbol. Desde luego, no puedo pensar. No puedo 
hacer nada» (Roth, en Patrimony, 1991, p. 129). 


Por lo que yo sé, hay muy poco trabajo empírico sobre este estado. Esto no es 


muy sorprendente, ya que dudo que tomar parte voluntariamente en un 
experimento psicológico hubiera estado en un lugar prioritario entre su lista de 
actividades por aquel entonces. Sin embargo, ha habido estudios sobre los 
efectos de otra poderosa emoción, concretamente el miedo. Estos efectos son de 
una importancia claramente considerable para las actividades bélicas del 
soldado, o en situaciones igualmente peligrosas pero menos agresivas, como en 
el caso de artificieros, o el trabajo de los bomberos apagando un fuego. Aunque 
recopilar datos experimentales en el medio de una batalla, o un fuego, suponga 
algunos problemas prácticos, ha habido una serie de estudios en los que, o bien 
se ha simulado el peligro, o bien el peligro acompañaba a una actividad 
deportiva voluntaria pero arriesgada. 


Quizá uno de los estudios más extremos fue una serie de experimentos llevados 
a Cabo por el ejército de los Estados Unidos antes de que los comités éticos se 
convirtieran en una cuestión típica de la investigación. Berkun et al. (1962) 
diseñaron una pieza de equipamiento que supuestamente era un radiotransmisor. 
Se dispuso de tal forma que el equipo fallara durante un ejercicio militar, pero 
estaría acompañado por instrucciones para su reactivación. Las instrucciones 
eran complejas, y de hecho implicaban una serie de etapas distintas, cada una 
compuesta por un subtest de puntaciones. Se realizaron una serie de 
experimentos de campo en los que el equipo fallaba, bien en circunstancias no 
estresantes, o bien en circunstancias estresantes. Entre los estresores se incluía, 
en un caso, un accidente de radiación simulada, y en otro, un incidente en el que 
al desafortunado sujeto se le dejaba creer que acababa de hacer volar a uno de 
sus compañeros soldados, y necesitaba la radio urgentemente para pedir ayuda. 
En esta última condición, un infortunado sujeto entró en pánico e intentó dejar la 
escena, regresando solo cuando recibió la orden del experimentador escondido al 
acecho entre los arbustos, un suceso que luego describió como el dictamen de su 
conciencia. En el tercer experimento, también asombroso, se informó a un 
escuadrón que el avión estaba a punto de caerse, y que para obtener un seguro 
adecuado tendrían que completar un formulario que luego se colocaría en un 
recipiente con pruebas del accidente. De nuevo, el formulario constaba de una 
serie de test cognitivos. No sería sorprendente que los desafortunados sujetos de 
cada uno de los experimentos rindieran mucho peor en circunstancias con riesgo 
para la vida que los grupos equivalentes bajo condiciones control. 


¿Qué ocurre con los efectos cognitivos de las emociones positivas extremas? 
Estas emociones parecen estar incluso menos estudiadas que el miedo extremo. 
Sin embargo, hay evidencias que sugieren que la euforia que experimentan los 


paracaidistas novatos al aterrizar con éxito puede ser tan disruptiva como la 
ansiedad previa al salto (Macdonald y Labuc, 1982), mientras que los datos de 
pacientes maniacodepresivos sugieren que la cognición está tan interrumpida 
durante la fase de manía como lo está durante la fase de depresión (Bulbena y 
Berrios, 1993; Murphy et al. , 1999). 


14.1.1. La naturaleza del déficit cognitivo 


Los estudios de Berkun et al. (1962) están relacionados con niveles extremos de 
miedo. ¿Puede que otras emociones, incluso positivas, tuvieran un efecto 
cualitativo similar y que este efecto siempre deteriorara el rendimiento? 
Probablemente este no sea el caso. El estudio de Murphy et al. (1999), por 
ejemplo, encontró que los pacientes maníacos tenían dificultades con pruebas de 
memoria y planificación, mientras que los depresivos tenían dificultades para 
cambiar la atención. 


En el caso del miedo, parece posible aplicar la ley de Yerkes-Dodson. Esta ley 
propone una relación en forma de U invertida entre el rendimiento y el nivel de 
arousal. Dependiendo de la tarea, existe un nivel de arousal óptimo, por encima 
y por debajo del cual el rendimiento empeora (Yerkes y Dodson, 1908). Por ello, 
cuando se corre con rapidez es probable alcanzar picos mayores de miedo que 
cuando se enhebra una aguja. También se ha sugerido (Broadbent, 1971; 
Baddeley, 1972) que el nivel óptimo de arousal dependerá de la complejidad de 
la tarea, siendo mejor un nivel alto de arousal para tareas motoras simples, como 
correr O llevar un sistema de control simple, como conducir un coche, mientras 
que niveles bajos son más óptimos para habilidades más refinadas o menos 
practicadas, como enhebrar una aguja o manejar un sistema de rastreo con 
retroalimentación no lineal demorada. Una prueba de este enfoque proviene de 
un estudio de Walker y Burkhardt (1965) sobre el control de misiles bajo 
condiciones operativas. Recopilaron datos operativos de campo para tres tipos de 
sistemas de control; el más sencillo fue un control de velocidad demorado; el 
siguiente, un control basado en la aceleración, y el más difícil incluía aceleración 
junto con demora. Los tres alcanzaron un buen rendimiento bajo condiciones de 
bajo riesgo. Sin embargo, un incremento en la severidad del riesgo de pérdida 
del avión de un 2 por ciento, a un 5 y hasta un 10 por ciento, el máximo riesgo 


considerado operativamente aceptable, incrementó la tasa de error de control, de 
forma constante para el sistema de control simple y dramáticamente para el más 
complejo. 


14.1.2. La hipótesis del estrechamiento atencional 


Se ha sugerido que un alto arousal causa un estrechamiento del campo 
atencional. Esto se ha visto apoyado por un estudio con buceadores en 
condiciones submarinas estresantes, y por una tarea equivalente realizada en la 
superficie (Weltman et al. , 1970; Weltman et al. , 1971). Se pidió a los 
buceadores que realizaran una tarea principal, y al mismo tiempo que detectaran 
señales esporádicas de luces periféricas. Bajo estrés, el rendimiento en la tarea 
principal se mantuvo, pero las señales periféricas se detectaban peor. El 
estrechamiento de la atención que aparece bajo situaciones de estrés ha 
caracterizado de forma prominente a la literatura sobre el testimonio de testigos, 
con el conocido efecto del «foco en el arma». Los sujetos espectadores de una 
situación emocionalmente amenazante, como un atraco, o una persona huyendo 
de un crimen con manchas de sangre, tienden a centrar su tención sobre la fuente 
de amenaza y son menos capaces de relatar detalles del asaltante que los sujetos 
bajo condiciones menos amenazantes (Loftus, 1979; Christianson y Loftus, 
1991). 


En la hipótesis del estrechamiento atencional está implícita la idea de que la 
capacidad atencional es limitada, por ello, si centramos nuestra atención en un 
objeto concreto, menos atención quedará para los otros. Por tanto, los 
infortunados soldados estudiados por Berkun et al. (1962) estarían dedicando 
presumiblemente una cantidad sustancial de su atención a preguntarse si huirían 
y cómo de su terrible situación. Esta explicación se ha aplicado a las frecuentes 
observaciones sobre el pobre rendimiento en memoria en pacientes con 
trastornos emocionales (Dalgleish y Cox, 2002) y fue empleada por Ellis para el 
Modelo de Asignación de Recursos (Ellis y Ashbrook, 1988; Ellis y Moore, 
1999). 


De este modelo se desprende que cualquier cosa que haga uso de una capacidad 
atencional es probable que acentúe los efectos de la emoción. Esto fue 


examinado directamente por MacLeod y Donnellan (1993) usando dos grupos de 
sujetos normales, seleccionados con un alto o bajo nivel de ansiedad rasgo, a 
través de un autoinforme de tendencia a la ansiedad. Los sujetos tenían que 
realizar una tarea de razonamiento verbal en combinación con una tarea verbal 
concurrente fácil (pronunciar repetidamente el cero) o bien una tarea más 
demandante que consistía en la repetición de una secuencia de seis dígitos, que 
cambiaba tras cada repetición. Como suponíamos, los sujetos ansiosos lo 
hicieron peor, mostrando un efecto mayor con la tarea secundaria demandante. 
Presumiblemente, la dura tarea secundaria estaba generando ansiedad, 
disminuyendo aún más la capacidad atencional. 


Un estudio realizado por mí analizaba el efecto de la narcosis de nitrógeno sobre 
los buceadores a gran profundidad, que consiste en un estado parecido a la 
embriaguez que aparece cuando se respira aire a unos 100 pies o más de 
profundidad. Pusimos a prueba a los buceadores con una tarea motora simple en 
la que se les pedía que trasladaran tornillos de un extremo de un plato metálico 
hasta el otro lo más rápido posible. Realizaron la tarea en tierra y bajo el agua, 
en profundidades de 10 pies, cuando aún no hay efecto narcótico, y a 100 pies. 
Un segundo grupo fue examinado fuera del agua, bajo presiones equivalentes de 
10 y 100 pies obtenidas mediante una cámara de buceo. Encontramos que 
ejecutar la tarea bajo el agua disminuía el rendimiento de los sujetos, de la 
misma forma que bajo la influencia de la narcosis. Sin embargo, cuando se 
combinaban estas dos situaciones estresantes, poniendo a los buceadores a una 
profundidad de 100 pies en mar abierto, el rendimiento se deterioraba mucho 
más de lo esperado si solo se hubiera sumado el efecto del agua más el de la 
profundidad. 


¿Qué estaba causando esta interacción? Descubrimos la respuesta 
inesperadamente en un experimento posterior. Nuestro primer experimento se 
llevó a cabo en un barco en mar abierto. Los sujetos eran una mezcla de 
buceadores amateur, miembros del Club de Buceo de la Universidad de 
Cambridge, y soldados, Ingenieros Reales que habían sido entrenados para 
bucear en aguas poco profundas pero sin experiencia en mar abierto, donde es 
necesario bucear hacia abajo, «hacia lo azul». Nuestra réplica posterior también 
usó estudiantes y buceadores del ejército. Sin embargo, en esta ocasión los 
buceadores se sumergían primero en zonas poco profundas y gradualmente iban 
bajando hasta llegar a los 100 pies, lo que suponía una experiencia mucho menos 
amenazante (Baddeley et al. , 1968). Bajo estas condiciones, observamos el 
esperado decremento debido a la realización de la tarea bajo el agua, junto con el 


efecto narcótico que no fue mayor que el observado en la cámara de 
presurización seca. Parecía probable que el factor crucial que producía la 
interacción entre la narcosis en mar abierto y la profundidad fuera el grado de 
ansiedad. 


Pusimos directamente a prueba esta hipótesis en un estudio posterior bajo 
condiciones mucho más estresantes en costas escocesas (Davis et al. , 1972). 
Usamos buceadores estudiantes y medimos el nivel de ansiedad 
electrofisiológicamente, así como a través de escalas de valoración subjetiva. 
Bajo estas condiciones, nuestros buceadores sí experimentaban ansiedad con la 
profundidad, y de nuevo mostraron un efecto mucho mayor de la profundidad 
cuando se les examinó bajo el agua. Asumimos que la interacción provenía, por 
tanto, de una combinación del reconocido decremento cognitivo a partir de la 
narcosis de nitrógeno, junto con el reto de actuar bajo condiciones más 
estresantes. Cuando estás a 100 pies de profundidad, no es extraño que al menos 
le dediques algo de atención a cerciorarte de que nada está yendo mal. 


14.1.3. Foco atencional y pensamientos intrusivos 


Es importante apuntar, sin embargo, que incluso bajo estas condiciones 
estresantes, no todas las tareas muestran esta clara interacción. En un estudio 
posterior se comparó el rendimiento de buceadores principiantes en mar abierto, 
bien respirando aire, o bien oxihelio, que es menos narcótico, estudiando en esta 
ocasión el rendimiento a 200 pies de profundidad, que en aquel momento se 
consideraba que era el máximo de profundidad permitida para bucear. El 
rendimiento en la tarea del plato de metal de nuevo mostró la interacción con la 
profundidad predicha, pero esta interacción no se encontró en el caso de una 
tarea de razonamiento verbal demandante (Baddeley y Flemming, 1967). 


Una explicación posible a este inesperado resultado la proporcionaron una serie 
de estudios de Lavie (Lavie, 1995; 2000) en los que demostró que la capacidad 
de los estímulos periféricos irrelevantes para interrumpir un procesamiento 
visual descendería a medida que el nivel de dificultad de la tarea central 
aumentara. Con una tarea perceptiva demandante, la atención se centra 
firmemente sobre el estímulo relevante. Con una tarea más fácil, sin embargo, 


habría suficiente capacidad atencional de más para dedicarla a estímulos más 
periféricos y potencialmente distractores. Lavie (1995; 2000) se ha concentrado 
en la atención visual, pero es probable que el efecto sea más general, cuando la 
atención se centra sobre una tarea central demandante, habrá menos 
probabilidades de escanear tanto el medio físico como mental, en busca de otras 
fuentes de información. Presumiblemente, en el caso de nuestros buceadores, la 
tarea de razonamiento era suficientemente absorbente como para reducir la 
atención hacia pistas ambientales potencialmente preocupantes. De hecho, uno 
de los buceadores no se percató del hecho de que su aire se estaba escapando 
haciéndole ascender de forma rápida y potencialmente peligrosa. 


La capacidad de una tarea cognitiva demandante para centrar la atención en esa 
tarea en cuestión tiene implicaciones interesantes para los estudios acerca del 
estrés, ya que los instrumentos diseñados para medir el decremento del estrés 
habrían tenido un efecto reductor del estrés al ayudar al sujeto a evitar 
pensamientos intrusivos. Esta posibilidad posee ciertas implicaciones para 
ayudar a las personas a evitar estos pensamientos intrusivos, tal como veremos 
más adelante. 


¿Cómo se evitaría entonces la ansiedad y los pensamientos intrusivos? Una 
posibilidad sería centrar la atención en una tarea no amenazante, la cual, si es 
suficientemente demandante, alejará los pensamientos intrusivos. Evidencia de 
esto se consiguió en un estudio de Teasdale et al. ( 1995) en el que 
preguntábamos a los sujetos periódicamente acerca de sus pensamientos durante 
la realización continua de una serie de tareas. Cuanta más práctica tenían los 
sujetos en cada tarea, más automática se hacía, y mayor era la probabilidad de 
que se dieran pensamientos irrelevantes. Sin embargo, estos pensamientos se 
podrían reducir añadiendo otra tarea más. Esta tarea no necesita ser demandante 
siempre que implique tomar una decisión de forma ocasional. Teasdale et al. 
concluyeron que el desarrollo de una cadena de pensamientos sostenidos y 
potencialmente disruptivos dependía de la continua disponibilidad del ejecutivo 
central. Parece que estas secuencias de pensamiento intrusivas e irrelevantes 
pueden estar interrumpidas en sujetos normales al menos de forma relativamente 
sencilla, lo que animó a Levey et al. (1991) a basar un tratamiento de insomnio 
en este enfoque, pidiendo a los sujetos que interrumpieran la cadena de 
pensamientos que dificultaban su sueño pronunciando de forma subvocal una 
sola palabra a intervalos aleatorios, esta aleatoriedad impide que la supresión se 
vuelva automática y por tanto inefectiva, igual que ocurre con el tradicional 
método para conciliar el sueño consistente en contar ovejitas. 


14.1.4, Memoria de trabajo e hipótesis de la preocupación 


¿Cuál es el mecanismo concreto por el cual la emoción interfiere con la 
cognición? Una posible respuesta se da en términos de la teoría del 
procesamiento eficiente de Michael Eysenck (Eysenck, 1992). Esta teoría asume 
un sistema de memoria de trabajo de capacidad limitada, que en condiciones 
amenazantes se volvería excesivamente preocupada con pensamientos acerca de 
lo que podría ir mal, dejando menos capacidad disponible para la tarea en 
cuestión. Sin embargo, la eficiencia se mantendría siempre que se invirtiera más 
esfuerzo. Cuando esto no es suficiente para mantener el rendimiento se adoptaría 
una nueva estrategia. Si esto a su vez falla, se produce un decremento cognitivo 
(Eysenck y Calvo, 1992). Los sujetos que son altamente ansiosos es probable 
que se vean más desafiados por la distracción de las amenazas potenciales, y que 
bajo condiciones estresantes empiecen a mostrar déficits cognitivos, lo que 
algunas veces denominamos como la hipótesis de la preocupación. Esto se ha 
explorado en una serie de estudios en los que se pedía a los sujetos que 
procesaran fragmentos de textos que después tenían que recordar. Se comparó a 
estudiantes con un alto nivel de ansiedad rasgo autoinformada con estudiantes 
con bajos niveles de ansiedad rasgo autoinformada. Calvo et al. (1994) 
encontraron que los sujetos ansiosos eran capaces de mantener su nivel de 
comprensión, pero realizando más movimientos oculares regresivos mientras 
leían. Cuando esta estrategia no era posible, al presentar las palabras de una en 
una, los sujetos ansiosos aún mantuvieron su rendimiento en comprensión, pero 
respondieron de forma más lenta y articulaban de forma más abierta, 
especialmente en la condición en la que intentaban ignorar el habla irrelevante 
(Calvo et al. , 1993). Sin embargo, cuando se impidieron los movimientos 
oculares regresivos así como el repaso subvocal, combinando la presentación de 
palabras de una en una con el habla irrelevante y con la supresión articulatoria, 
emergió una clara diferencia, los sujetos con una alta ansiedad mostraron una 
peor comprensión (Calvo y Eysenck, 1996). 


14.1.5. El papel de la represión 


En los experimentos descritos anteriormente, los sujetos desarrollaban 
estrategias para sobrellevar los efectos disruptivos de la ansiedad. Sin embargo, 
otro método consiste en intentar suprimir la ansiedad. Esta forma de sobrellevar 
la ansiedad parece reflejar un rasgo de personalidad relativamente estable que se 
puede detectar de forma fiable mediante cuestionarios. Estos sujetos se 
denominan represores y cuando se les examina en una situación potencialmente 
estresante, como por ejemplo antes de dar un discurso en público, tienden a 
informar de niveles relativamente bajos de ansiedad, al mismo tiempo que 
muestran signos de ansiedad claramente objetivos, como indican las medidas 
fisiológicas (Newton y Contrada, 1992; Weinberger, 1990). Esto suscita la obvia 
cuestión de si estos sujetos simplemente están mintiendo respecto a su 
experiencia o si genuinamente son capaces de inhibir los pensamientos y 
sentimientos ansiosos. Esto fue investigado por Derakshan y Eysenck (1998) en 
un estudio en el que seleccionaron cuidadosamente muestras de sujetos 
ejecutando una tarea de razonamiento, bajo una leve o una fuerte carga cognitiva 
concurrente. 


La tarea primaria era una tarea que sabemos que depende fuertemente de la 
memoria de trabajo, en la que los sujetos tenían que comprobar unas frases que 
pretendían describir el orden de dos letras, por ejemplo, A no está precedida de B 
— AB (Baddeley, 1968; Baddeley y Hitch, 1974). La fuerte carga requería que los 
sujetos escucharan y repitieran secuencias de seis números aleatorios al mismo 
tiempo que respondían a una tarea de razonamiento, mientras que la condición 
de carga leve consistía simplemente en escuchar y repetir seis ceros. 
Seleccionaron sujetos con altos o bajos niveles de ansiedad autoinformada, y 
cada grupo se dividió a su vez en sujetos con una alta o baja tendencia a suprimir 
la ansiedad, dando lugar a cuatro grupos. Todos los grupos realizaron la tarea de 
razonamiento bajo condiciones de una alta carga concurrente en memoria y bajo 
condiciones de baja carga concurrente. 


Como esperábamos, los grupos no diferían en su nivel de rendimiento bajo una 
leve carga, mientras que la imposición de una tarea secundaria demandante 
deterioró claramente el rendimiento del grupo de sujetos que eran ansiosos tanto 
en términos de su propia valoración como en su respuesta fisiológica. La 
comparación crucial, sin embargo, se refería al cuarto grupo, los represores de 
ansiedad fisiológica. En este caso, su rendimiento era consistente con su informe 
subjetivo; a pesar de mostrar claros signos fisiológicos de ansiedad, el 


rendimiento se parecía al del grupo no ansioso. Parece que los represores 
ciertamente estaban consiguiendo reprimir su ansiedad, y no estaban 
simplemente mintiendo acerca de sus sentimientos. Esto a su vez suscita la 
interesante cuestión de si las personas ansiosas pueden ser entrenadas para 
reprimir la ansiedad. Uno podría pensar, quizá, que ciertas formas de terapia 
cognitiva para estados de ansiedad se podrían considerar como un entrenamiento 
para controlar el pensamiento, y de hecho un entrenamiento de represión. 


Más evidencias acerca de este tema provienen de estudios de ansiedad en 
personas que de forma voluntaria se involucran en deportes de riesgo como el 
paracaidismo. Epstein (1962; Fenz y Epstein, 1962) estudió a paracaidistas 
novatos y expertos, registrando su GSR y su entusiasmo autoinformado en 
distintas etapas, antes y después del salto. Los novatos tenían un mayor arousal y 
menos entusiasmo a medida que se acercaba el salto, invirtiéndose el patrón 
después del salto. Los saltadores experimentados muestran ansiedad, ansiedad 
que se desplaza en el momento del salto, un proceso que Epstein atribuye al 
proceso de aprendizaje, por el cual el entrenamiento da lugar a una inhibición de 
la ansiedad en el momento del salto. Desde un punto de vista evolutivo, la 
Capacidad para aprender a «mantener la cabeza fría» parecería ventajosa. 
Siguiendo el modelo de discriminación desarrollado para el aprendizaje animal 
por Spence (1937), Epstein sugiere que la distribución de la inhibición es más 
estrecha y más apuntada que la de la ansiedad, dando lugar a un desplazamiento 
del punto de máxima ansiedad lejos del momento del salto, un fenómeno 
conocido como cambio de pico. Los resultados de Epstein son intrigantes, pero 
podrían representar, o bien los efectos del entrenamiento, o bien posiblemente 
reflejen un abandono selectivo, si solo perseveraran los represores. Un estudio 
longitudinal ayudaría a decidir entre estas posibilidades. 


La evidencia hasta el momento es consistente con la perspectiva de que los 
pensamientos negativos, y quizá también los pensamientos fuertemente 
positivos, podrían ocupar la memoria de trabajo. Es probable que influyan en el 
funcionamiento del ejecutivo central así como en el búfer episódico, y que por 
tanto interrumpan el rendimiento de otras tareas cognitivas. Es más, parece 
posible aprender a inhibir la ansiedad, en conexión con situaciones específicas 
como el paracaidismo, o bien como un rasgo de personalidad más general. Hay, 
sin embargo, muchas personas y muchas situaciones en las que la ansiedad no 
está controlada, dando lugar posiblemente a un sufrimiento considerable, que se 
ve exacerbado por el deterioro asociado en la capacidad cognitiva y por la 
interrupción de la actividad social. 


14.2. Estudios clínicos de ansiedad y cognición 


William et al. (1997) describen a dos pacientes que sufrían seriamente de 
ansiedad. El paciente M.M. tenía una fobia específica a los pájaros. Su trabajo le 
obligaba a estar en un pequeño hangar de aviones; de vez en cuando los pájaros 
podían entrar y quedar atrapados, lo que le hacía sentirse triste y llorosa. Le 
asustaban tanto los pájaros vivos como muertos, y evitaba pasar cerca de 
mercados o pollerías donde pudiera encontrar aves de corral. Su miedo se 
extendía a estímulos remotos en su ambiente que pudieran ser potencialmente 
interpretados como pájaros, por ejemplo, una pluma en la calle, que luego 
resultara ser una hoja de plástico. 


La segunda paciente, T.S., sufría un trastorno de ansiedad generalizado (TAG). 
Estos pacientes no solo tienen un alto nivel de preocupación, sino que sus 
preocupaciones eran menos controlables, menos realistas y menos fáciles de 
corregir que las preocupaciones de las personas normales (Craske et al. , 1989). 
T.S. trabajaba en un astillero como soldador, pero fue incapaz de trabajar durante 
un tiempo debido a un estado de ansiedad crónico. Como consecuencia, 
temblaba y sudaba siempre que se encontraba en compañía de sus compañeros, 
un estado que no solo interfería en sus relaciones sociales, sino que también 
empezaba a tener impacto sobre la calidad de su trabajo, lo que a su vez 
incrementaba su ansiedad. Fuera del entorno de su trabajo, descubrió que era 
anormalmente sensible a las malas noticias del periódico, inspeccionando 
incluso el más remoto caso casi inmediatamente, y después sobreviniéndole 
pensamientos acerca de las terribles cosas que podrían pasarle a su mujer y a él 
mismo. Esto suponía una tensión para su mujer, lo que incrementaba aún más su 
ansiedad. 


14.2.1. Sesgo atencional y pacientes ansiosos 


Williams et al. (1997) se centraron en estos pacientes como un componente 
importante para su proyecto de aplicación de técnicas y conceptos de la 


psicología cognitiva al estudio de la emoción en general, y más específicamente 
a los problemas de pacientes con trastornos emocionales. Sugieren que un 
componente importante de los estados de ansiedad, como los descritos 
anteriormente, proviene de la tendencia de los pacientes a sesgar su atención 
hacia el objeto o situación temida. Ellos proponen que este sesgo puede aparecer 
en una serie de modalidades, visual, auditiva o táctil, y que es involuntario, 
aunque está potencialmente sujeto a un control voluntario, dadas las técnicas 
terapéuticas apropiadas. También sugieren que la ansiedad es susceptible de ser 
provocada ambientalmente, bien externamente por el entorno del sujeto, o bien 
internamente como resultado de los pensamientos y la memoria. Sugieren que 
esto constituye una exageración de la respuesta normal, la cual nos protege de 
los peligros potenciales, y proporciona una vigilancia extra para usarla cuando la 
amenaza parezca mayor. Es más, aceptan que este sesgo emocionalmente basado 
no está limitado a los sentimientos negativos. Por ejemplo, cuando vas a comprar 
una casa, tiendes a ver carteles de «se vende» por todos los sitios, incluso cuando 
estás en una zona del país en la que no tienes intención de vivir. Lo mismo 
ocurre cuando te compras un coche nuevo, tiendes a percibir el mismo modelo 
por donde quiera que vayas. 


Evidencia de este tipo de sesgo atencional ha estado disponible durante muchos 
años. Por ejemplo, Parkinson y Rachman (1981) estudiaron a madres con niños 
en tratamiento por amigdalitis. Estudiaron dos grupos, en uno de ellos, los niños 
acababan de ser admitidos para una intervención, y en el otro, la intervención era 
menos inminente. Se pidió a las madres que trataran de detectar tres tipos 
distintos de palabras entremezcladas con música; palabras directamente 
relevantes (e.g., sangrando, inyección, operación), un segundo tipo era 
acústicamente similar pero no era relevante (e.g . respiración, inflexión, 
operacional) y un tercer grupo control (e.g., periódico, pájaro, uniforme). Las 
madres cuyos hijos habían sido admitidos para una intervención mostraron una 
mayor detección de las palabras directamente relevantes, y una detección 
intermedia de las palabras acústicamente similares, pero no se diferenciaron del 
grupo de madres con hijos no admitidos en cuanto a las palabras control. 


Otros estudios han usado el procedimiento de escucha dicótica, por el cual los 
sujetos repiten las palabras que les llegan por un oído e intentan ignorar las que 
le llegan por el otro. Bajo estas circunstancias, los sujetos bulímicos escuchaban 
con más probabilidad la palabra «gordo» presentada por el oído desatendido que 
los sujetos control sin trastornos alimentarios (Schotte et al. , 1990). Sin 
embargo, tanto los estudios de ansiedad hospitalaria como los de trastornos 


alimentarios, podrían reflejar simplemente un sesgo en la respuesta general, en 
vez de un efecto de la ansiedad. Por ejemplo, las palabras críticas tendrían un 
umbral de detección menor, posiblemente porque estas palabras son más 
frecuentes en la experiencia del grupo experimental. 


14.2.2, Los problemas del sesgo de respuesta 


En un intento de evitar el problema del sesgo de respuesta, Mathews y MacLeod 
(1986) variaron el diseño, de forma que las palabras cruciales no se pedían como 
respuesta en ningún momento. Se pidió a los sujetos que respondieran 
manualmente a una serie de estímulos visuales neutrales. Al mismo tiempo se les 
pidió que repitieran palabras presentadas en un oído, a la vez que ignoraban las 
presentadas en el otro oído. Las palabras desatendidas podían ser neutrales o 
bien amenazantes, y se examinaron tanto los sujetos ansiosos como los no 
ansiosos. Ningún grupo fue capaz de informar de las palabras no atendidas, pero 
cuando eran amenazantes, disminuyó el tiempo de reacción a los dibujos neutros 
presentados visualmente en el grupo ansioso, sugiriendo que ignorar las palabras 
emocionales suponía una demanda atencional para los sujetos ansiosos. Ya que 
no se pedía que pronunciaran las palabras emocionales, el sesgo de respuesta 
parece una explicación menos plausible que la explicación basada en una 
sensibilidad perceptiva diferente. 


Un método ingenioso para evitar el problema del sesgo de respuesta en los 
estudios que usan presentación visual es la técnica del rastreo del punto, muy 
utilizada por Mathews y colegas. MacLeod et al. (1986) presentaron a sus 
sujetos dos palabras, una encima de la otra. La tarea del sujeto consistía en 
nombrar la palabra superior. Poco después de que desapareciera la palabra, de 
vez en cuando aparecería un punto, a lo que el sujeto tendría que responder 
presionando un botón tan rápido como pudiera. Se examinó a sujetos con 
ansiedad alta y baja y con material que incluía palabras amenazantes que podían 
aparecer arriba o abajo. La cuestión crucial era cuánto tiempo se necesitaba para 
responder al punto. Todos los sujetos respondían más rápidamente si el punto se 
situaba arriba, justo donde estaba la palabra que acababan de nombrar. Cuando la 
palabra amenazante había aparecido arriba, los sujetos ansiosos respondían más 
rápidamente que los sujetos control. Sin embrago, si la palabra amenazante 


aparecía abajo, ellos, pero no los sujetos control, respondían al punto superior 
más lentamente. Parece, por tanto, que su atención había sido captada por la 
palabra amenazante, un efecto que se daba a pesar del hecho de que tanto el 
punto como la respuesta manual eran en sí mismos neutrales. 


Más evidencia en contra de la simple interpretación del sesgo de respuesta 
proviene de un estudio de MacLeod y Mathews (1988), en el que se examinó a 
estudiantes de medicina con alta y baja ansiedad, usando la tarea del rastreo del 
punto y una mezcla de palabras neutras y palabras relacionadas con los 
exámenes. Cuando se les examinó durante un período sin exámenes, ningún 
grupo mostró efectos del tipo de palabra. Sin embargo, cuando se les examinó 
una semana después del examen, los estudiantes ansiosos mostraron una 
respuesta más rápida ante el punto aparecido inmediatamente después de una 
palabra del examen situada en el mismo lugar, como si su atención se hubiera 
desplazado a la fuente de su ansiedad mientras que los sujetos control mostraron 
el efecto opuesto, siendo algo más lentos tras una palabra del examen, como si la 
estuvieran evitando. Mogg et al. (1990) demostraron que incluso un período de 
estrés muy breve, producido al intentar resolver anagramas que en realidad eran 
imposibles, dio lugar a un sesgo en la dirección de las palabras amenazantes al 
emplear la tarea del rastreo del punto. 


14.2.3. La tarea del Stroop emocional 


Aunque la tarea del rastreo del punto es ingeniosa, es importante no confiar 
demasiado en un solo paradigma. Afortunadamente se ha desarrollado un 
enfoque alternativo al mismo problema, usando una modificación del test de 
Stroop. En la tarea clásica, los sujetos tienen que decir el color en el que están 
escritas una serie de palabras, y en la condición crítica, las propias palabras 
designan colores, de forma que el color con el que están escritas es inconsistente 
con el nombre del color, por ejemplo, la palabra rojo escrita con tinta verde. Bajo 
esta condición de conflicto, nombrar la tinta con la que están escritas las palabras 
requiere más tiempo que nombrar el color de la tinta de una palabra que designe 
un color, lo que a su vez requiere más tiempo que nombrar el color de la tinta de 
una fila de equis. La tarea del Stroop emocional es una variante en la que las 
palabras no son nombres de colores, pero se seleccionan por su potencial 


significado emocional. 


Por ejemplo, Watts et al. (1986) mostraron que las personas con un miedo 
desproporcionado a las arañas requieren más tiempo para nombrar el color de la 
tinta de palabras relacionadas con arañas, como «telaraña» y «peluda», que para 
nombrar palabras relacionadas con una ansiedad más general, como «fracaso» y 
«dolor». Mathews y MacLeod (1985) se interesaron por lo específico que 
podrían ser los efectos. Pusieron a prueba a personas ansiosas cuya ansiedad 
principal era social, o bien relacionada con una posible amenaza física. 
Encontraron un patrón de respuestas diferente, cada grupo era particularmente 
sensible a las palabras relacionadas con su propia fuente de ansiedad. Una 
asociación similar se encontró con palabras relacionadas con una sobredosis de 
droga frente a palabras de ansiedad en personas que habían intentado 
envenenarse (Williams y Broadbent, 1986), mientras que Hope et al. (1990) 
encontraron disociaciones similares entre palabras seleccionadas por su 
relevancia con palabras sobre la fobia social y palabras relacionadas con un 
ataque de pánico en los dos grupos de pacientes distintos. 


Sin embargo, es importante apreciar que no es necesario ser consciente de lo 
estresante o lo neutral que es la palabra para que se dé el efecto Stroop. Por 
ejemplo, una mera exposición de 20 milisegundos a palabras relacionadas con la 
ansiedad antes de realizar la parte de la tarea en la que se nombran colores, es 
suficiente para enlentecer esta respuesta en pacientes ansiosos (MacLeod y 
Rutherford, 1992; Mathews y MacLeod, 1994). Este efecto no apareció en 
pacientes depresivos pero no ansiosos (Mogg et al. , 1993). 


Debemos hacer un último comentario. Hemos interpretado los datos disponibles 
como evidencia de que los estímulos emocionales captan la atención 
diferencialmente. Sin embargo, también es posible explicar estos resultados 
asumiendo que la emoción dificulta la división de la atención, posiblemente 
deteriorando los procesos inhibitorios (Fox, 1994; Fox et al. , 2001). Las 
implicaciones de una distracción general de la hipótesis de la preocupación son 
ampliamente equivalentes para estas dos interpretaciones, aunque poseen 
implicaciones diferentes a nivel de modelos más detallados. Discutiremos esto a 
continuación. 


14.3. Modelando el impacto de la ansiedad y de la cognición 


Un aspecto de la relación entre el miedo, la ansiedad y la atención parece gozar 
de un amplio acuerdo, concretamente su función evolutiva como mecanismo 
primitivo de advertencia para detectar un peligro potencial (Oatley y Johonson- 
Laird, 1987). Ohmán (1993; 1996) defiende de forma convincente la naturaleza 
evolutiva de la rápida orientación preatencional hacia las amenazas, 
demostrando que ciertos estímulos potencialmente dañinos, como las serpientes 
y las setas venenosas, se detectan más fácilmente que otros estímulos naturales 
menos dañinos, como las flores, y además se condicionan más fácilmente a una 
respuesta de evitación. LeDoux (1996) ha clarificado elegantemente las 
conexiones neurales asociadas a las respuestas a las fuentes de miedo, 
demostrando dos caminos diferentes, ambos con destino a la amígdala, la cual se 
relaciona con las respuestas emocionales. Un camino es directo y 
extremadamente rápido, mientras que el otro toma una ruta directa hacia la 
corteza. Es probable que ambos se correspondan con un procesamiento 
preconsciente y consciente respectivamente. 


Debido a la importancia clínica que tiene para la comprensión y el tratamiento 
de los trastornos de ansiedad, ha existido un gran interés por intentar explicar la 
relación entre ansiedad y función cognitiva. Una de las interpretaciones más 
tempranas, y ciertamente una de las más influyentes en clínica, es la propuesta 
por Beck (1976), que dio lugar al desarrollo de la terapia cognitiva tanto para la 
depresión como para la ansiedad. Ha sido particularmente influyente en el 
tratamiento de la depresión, y la discutiremos en el próximo capítulo. 


14.3.1. Modelos cognitivos de ansiedad y rendimiento 


Williams et al. (1988; 1997) propusieron una explicación de la interacción entre 
la emoción y la cognición que está directamente influida por los recientes 
desarrollos en psicología cognitiva. Ellos proponen un sistema de detección 
preconsciente, seguido de un sistema de evaluación. Según el grado de amenaza 
señalado por el sistema de evaluación, o bien se pone atención al estímulo, o 
bien se inhibe la atención. Las diferencias individuales se darían en el proceso de 
evaluación; los sujetos con altos rasgos ansiosos tendrían una tendencia a 


centrarse en la amenaza potencial, mientras que los bajos en ansiedad ignorarían 
la amenaza. Sin embargo, se ha sugerido que este último supuesto no es 
plausible desde el punto de vista evolutivo, ya que parece predecir que estos 
pacientes seguirán ignorando consistentemente la amenaza, por muy grande que 
sea (Mathews y Mackintosh, 1998; Mogg y Bradley, 1998). Este enfoque 
también parece sugerir que los pacientes que tienen tanto depresión como 
ansiedad mostrarán la misma tendencia a la detección preatencional del estímulo 
amenazante que la que muestran los pacientes ansiosos pero no depresivos, lo 
cual no parece ser el caso (Bradley et al. , 1995; Mogg y Bradley, 1998). 


Para evitar estos problemas, Mogg y Bradley (1998) proponen una modificación 
del modelo de Williams et al., la hipótesis cognitivo-motivacional. Esta hipótesis 
asume que un estímulo posee una valencia, positiva o negativa, así como un 
componente motivacional. Se supone que la ansiedad es motivacionalmente 
aversiva, dando lugar a un remarcado grado de atención, una rápida respuesta a 
la amenaza y una actividad autonómica incrementada. Al igual que Williams et 
al. , ellos asumen dos etapas, una que implica la detección y evaluación del 
estímulo potencialmente amenazante, y la otra relacionada con el desarrollo y 
movilización del procesamiento cognitivo posterior. A diferencia de Williams et 
al., ellos interpretan que la influencia de la ansiedad estado o rasgo opera a 
través de un sesgo en el proceso de evaluación. Los sujetos ansiosos tenderán a 
tener un umbral más bajo por encima del cual su atención será captada por una 
amenaza potencial (ver Fig. 14.1). Asumen otro supuesto más en referencia a la 
función que relaciona el grado de amenaza con la probabilidad de que esta 
amenaza atraiga la atención, según el cual los estímulos ligeramente negativos 
tienen una tendencia a inhibir la atención que ha de ser ignorada activamente. 
Ellos sugieren que la tendencia aparentemente paradójica que lleva a que una 
amenaza leve inhiba la atención tiene dos funciones positivas. La primera es que 
ayuda a centrar la atención, y frena la tendencia de cada estímulo ligeramente 
negativo a demandar un procesamiento. La segunda podría ser resultado de la 
tendencia de la cognición a tener un sesgo ligeramente positivo, lo cual, dada la 
tendencia de los sentimientos negativos a reducir la actividad, proporcionaría 
una ventaja evolutiva. En conexión con este supuesto, ellos proponen que la 
ansiedad es un estado emocional aversivo que anima a la acción, mientras que la 
depresión es amotivacional. Retomaremos el modelo de Mogg y Bradley en el 
próximo capítulo. 
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Fig. 14.1. Modelo propuesto por Mogg y Bradley (2005) para explicar la 
influencia de la ansiedad sobre la función cognitiva. De Mogg y Bradley (2005). 
En: «Análisis cognitivo-motivacional de la ansiedad», Behav Res Ther, 36(9), 
80. Reproducido con el permiso de Elsevier. 


14.3.2. Ansiedad y memoria a largo plazo 


Dado que los sujetos ansiosos están atencionalmente sesgados hacia estímulos 
que provocan ansiedad, uno esperaría un sesgo similar en el recuerdo posterior. 
Sin embargo, no hay mucha evidencia robusta acerca de este sesgo que esté 
basada en el recuerdo de memorias autobiográficas (Levy y Mineka, 1998; 
Wenzel et al. , 2002) ni en material experimentalmente presentado (Mogg et al. , 
1987; Sanz, 1996). Aunque hay algunas evidencias de un especial recuerdo para 
las palabras relacionadas con un peligro amenazante en pacientes con trastornos 
de pánico (e.g., McNally et al. , 1989), una revisión reciente de la extensa 
literatura sobre ansiedad y memoria de MacLeod y Mathews (2004) concluye 
que «muchos estudios experimentales han fracasado al demostrar que los 
individuos ansiosos... exhiban consistentemente un remarcado recuerdo o una 
memoria de reconocimiento para material emocionalmente amenazante» 
(Macleod y Mathews, 2004, p. 180). 


14.4. Adicción y anhelo 


Al discutir los efectos de la emoción extrema y de la cognición, sugerimos que 
podría darse un patrón similar para las emociones positivas, como la alegría 
experimentada por un paracaidista novato que acaba de lograr un salto, así como 
con las emociones negativas, como la ansiedad que precede al salto. Sin 
embargo, implícitamente, todos los detallados análisis que hemos cubierto hasta 
el momento se han limitado al estudio del miedo y de la ansiedad. Aunque esto 
constituye un área de análisis muy extensa, los estudios sobre el anhelo 


proporcionan una fuente de evidencia alternativa, una forma de deseo extrema 
que tiende a estar asociada con la adicción, otro problema que supone una 
preocupación enorme y cada vez más práctica. 


Para el presente propósito usaremos el término adicción para referirnos a la 
dependencia fisiológica, y el término anhelo para referirnos al estado psicológico 
asociado. Como en el caso del miedo, los dos se correlacionan pero son 
separables. Los signos fisiológicos apetitivos, como la salivación y el incremento 
del ritmo cardíaco, muestran una correlación algo más baja con el deseo de 
comida, alcohol o drogas estimados de forma subjetiva (Monti et al. , 1993; 
Maude-Griffin y Tiffany, 1996). Es más, los indicios fisiológicos no siempre son 
muy específicos (Marshall y Zimbardo, 1979; Schachter y Singer, 1962), 
sugiriendo un posible componente común. Garavan et al. (2000) usaron la £MRI 
para estudiar la actividad cerebral de sujetos cocainómanos mientras veían una 
película acerca de la cocaína o bien una película pornográfica. Encontraron el 
mismo patrón de activación en las dos películas. 


14.4,1. Anhelo y cognición 


El anhelo se podría considerar como la imagen especular de la ansiedad, uno 
sesga la atención hacia la fuente de amenaza y el otro da lugar a una excesiva 
atención hacia los estímulos que evocan el objeto de deseo. El anhelo se puede 
inducir pidiendo al sujeto simplemente que se forme una imagen del objeto o de 
la sustancia de deseo (Cepeda-Benito y Tiffany, 1996; Zwaan y Truitt, 1998), 
encontrando una correlación entre la viveza estimada de la imagen y el posterior 
nivel de deseo informado (Drobes y Tiffany, 1997; Tiffany y Hakenewerth, 
1991). 


Como en el caso de la ansiedad, el anhelo puede inducir un sesgo atencional. 
Usando la técnica del rastreo del punto descrita previamente, Mogg et al. (2003) 
mostraron que fumadores privados de nicotina detectaban con más probabilidad 
un estímulo situado cerca de un dibujo relacionado con el tabaco que acababa de 
ser retirado que una imagen neutral, un efecto que ha demostrado estar 
relacionado con la magnitud del deseo informado (Walters et al. , 2003). Como 
en el caso de la ansiedad, estos sesgos parecen ser preatencionales, ya que 


pueden obtenerse bajo condiciones en las que los dibujos relevantes sean 
seguidos de un patrón enmascarado que impida tomar conciencia de que se ha 
presentado un dibujo. 


Una serie de estudios han demostrado que el rendimiento cognitivo se puede 
interrumpir por el anhelo. Por ejemplo, se ha encontrado un deterioro en el 
rendimiento cognitivo de las personas que siguen una dieta alimenticia. Aunque 
inicialmente se pensó que esto podría ser reflejo de los bajos niveles de azúcar 
en sangre (Benton y Sargent, 1992), esto se descartó posteriormente (Green y 
Rogers, 1995; Green et al. , 1997). Green y colegas propusieron en su lugar que 
la preocupación por la comida y por la forma del cuerpo que acompaña a los 
seguidores de una dieta (Rogers y Green, 1993; Warren y Cooper, 1988) podría 
interrumpir el rendimiento de los sujetos al estar ocupando la capacidad limitada 
de la MT. 


Green y Rogers (1998) usaron el modelo de Baddeley y Hitch como base de 
comparación entre los sujetos a dieta y los sujetos control, encontrando un 
deterioro en el recuerdo serial inmediato de letras y en la tarea de razonamiento 
de la Torre de Londres, mientras que encontraron un uso estratégico normal del 
bucle fonológico y de la agenda visoespacial. Un estudio posterior de 
Vreugdenburg et al. (2003) midió tanto el rendimiento cognitivo como el nivel 
de preocupación en grupos cuidadosamente equiparados, que tan solo diferían en 
si seguían o no una dieta. Los sujetos a dieta mostraron un deterioro en el 
paradigma de la doble tarea en el que la aritmética se combinaba con la 
supresión articulatoria o con la producción aleatoria, y también en tareas del 
bucle fonológico. Los análisis de correlación bivariada indicaron que entre un 53 
por ciento y un 96 por ciento de la varianza debida a seguir una dieta se podría 
atribuir a la medida en que los seguidores de una dieta informaban de 
pensamientos de preocupación. La sugerencia de Green y colegas de que el 
modelo de Baddeley y Hitch podría proporcionar una base útil para el estudio 
del anhelo ha sido más elaborada por Kavanagh et al. (en prensa) en una teoría 
general del deseo y del anhelo, que denominaron como la teoría de la Intrusión 
Elaborada (Kavanagh et al. , 2005). 


14.4.2. La teoría de la intrusión elaborada del anhelo 


La teoría se originó a partir de una interpretación especulativa sobre un 
argumento clínico extraño, concretamente que los flashback que acompañan al 
trastorno de estrés postraumático se podrían reducir mediante un procedimiento 
por el cual el paciente observa al terapeuta mover un dedo. Sugerimos que esto 
podría estar relacionado con el efecto de los movimientos oculares sobre la 
agenda visoespacial (Baddeley, 1986; Postle et al. , 2006), que quizá pudieran 
reducir la viveza de las imágenes perturbadoras de los pacientes (Baddeley y 
Andrade, 2000). Andrade et al. (1997) usaron imágenes evocadoras en sujetos 
normales, confirmando que efectivamente este era el caso, un resultado replicado 
posteriormente por Van den Hout et al. (2001). 


Mi implicación en este proyecto cesó en este punto, pero Andrade y Kavanagh 
continuaron colaborando, ampliando el interés de Kavanagh por la adicción y el 
anhelo, a través de una serie de estudios empíricos, que dieron lugar a una teoría 
del deseo y su capacidad para interrumpir la función cognitiva. Se supone que el 
aspecto crucial de esta interrupción es la presencia de intrusiones elaboradas 
dentro de la memoria de trabajo. El modelo se parece a la hipótesis de la 
preocupación de Eysenck, excepto en que se centra en necesidades apetitivas y 
no en la ansiedad, y está especificado con algo más de detalle. 


La teoría se basa en el supuesto de que el deseo —ya sea de comida, alcohol, 
cigarros o de amor— dará lugar a objetivos apetitivos que provocan 
automáticamente pensamientos intrusivos. Esto aparece, bien a través de indicios 
fisiológicos, como cuando te suenan las tripas de hambre, bien mediante indicios 
externos, como el olor a comida, o bien por asociación cognitiva, como el 
cacharreo de los platos en un comedor. Se supone que esto tiene dos efectos, uno 
automático y asociado con el placer o el alivio, y otro mediado cognitivamente 
que implica una elaboración de los indicios, por ejemplo, pensar en la próxima 
comida, un proceso que típicamente incluye imágenes visuales, aunque no 
exclusivamente. Estas elaboraciones interfieren después con el funcionamiento 
de la memoria de trabajo, desplazando pensamientos más constructivos, como en 
el caso de la interrupción que ocasionan las preocupaciones. Las imágenes 
sensoriales estimulan las características del objetivo, dando lugar a una 
estimulación mayor que de forma temporal es emocionalmente gratificante. Sin 
embargo, aumenta la conciencia de un déficit somático o emocional dando lugar 
a una frustración a largo plazo. 


Kavanagh et al. (2005) apoyan su teoría sobre la base de una serie de estudios. 
En un estudio de May et al. (2004) con autoinformes sobre sentimientos 


asociados con el anhelo se muestran los dos sentimientos más comunes que 
dicen estar fisiológicamente etiquetados: «Tengo hambre/sed», o aquellos que 
aparecen sin previo aviso: «De repente pensé en ello», sugiriendo que el sujeto 
no era consciente del estímulo o bien que lo había olvidado, una conclusión que 
se vio apoyada por un estudio sobre bebedores, en el que cuando se les pidió que 
informaran sobre la fuente de sus pensamientos acerca de la bebida durante las 
últimas 24 horas, en el 92 por ciento de los casos confesaron que la idea 
«simplemente había aparecido». 


Por el contrario, la etapa de elaboración parece depender típicamente de las 
imágenes (May et al. , 2004; Salkovskis y Reynolds, 1994). Kemps et al. (2004) 
preguntaron a mujeres que seguían una dieta o a sujetos control que generaran 
imágenes relacionadas con la comida y que valoraran su viveza. Las imágenes 
aumentaron el grado de anhelo informado, mientras que una tarea concurrente de 
memoria de trabajo visual redujo la viveza y el nivel de anhelo. Más evidencias 
de la interacción entre el anhelo y las imágenes provinieron de un estudio de 
Panabokke et al. (2004), en el que se encontró que pedir una imagen visual 
irrelevante, como por ejemplo un partido de tenis, disminuía el anhelo en sujetos 
privados de tabaco. Como en el caso de la ansiedad y la preocupación, estas 
intrusiones elaboradas interrumpen potencialmente la memoria de trabajo, 
medida a través de los tiempos de reacción prolongados en una tarea de sondeos 
de decisión (Franken et al. , 2000), o bien a través del procesamiento de frases 
complejas (Zwaan y Truitt, 1998), un efecto que fue particularmente claro para 
los sujetos con pequeñas amplitudes de memoria de trabajo. 


A pesar del efecto positivo inicial que causan las imágenes sobre la sustancia de 
deseo, la ausencia de satisfacción pronto da lugar a efectos emocionales 
negativos de ansiedad, frustración y rabia, que típicamente implican la amígdala 
y el área del cíngulo anterior del cerebro (Kilts et al. , 2001), dándose un patrón 
similar a través de una serie de anhelos entre los que se incluye el tabaco (Zinder 
et al. , 1992) y la cocaína (Powell et al. , 1992). A su vez, un estado de ánimo 
negativo hace más disponibles los indicios de privación, dando lugar a un 
incremento de la sensibilidad a los indicios relacionados con la sustancia 
anhelada cuando se pide a los pacientes que realicen una prueba estresante. 


14.5. Conclusión 


Nuestra revisión sobre los efectos del peligro, la euforia, la ansiedad y el anhelo 
sugiere que todos ellos parecen ser capaces de interrumpir la memoria de 
trabajo. Aunque es posible que se den pequeñas diferencias entre los 
mecanismos, en todos los casos los efectos parecen estar atencionalmente 
basados. Los indicios que en ocasiones se detectarían de forma preatencional dan 
lugar a elaborados patrones de pensamiento y, por tanto, reducen la capacidad de 
procesamiento de la memoria de trabajo disponible para la tarea en cuestión. 
Esta interpretación se puede acomodar fácilmente al modelo multicomponente, 
según el cual los estímulos potencialmente amenazantes son capaces de ganar 
acceso e interrumpir el ejecutivo central. En el caso del anhelo, los pensamientos 
intrusivos son de naturaleza positiva, dando lugar a una mayor elaboración 
dentro del búfer episódico. Esto podría ofrecer la esperanza de una interpretación 
general única de la relación entre la memoria de trabajo y la emoción. Antes de 
alcanzar esta conclusión, deberíamos considerar una perturbación emocional 
más, de gran importancia práctica, concretamente la depresión. Discutiré la 
depresión en el próximo capítulo, antes de retomar la cuestión acerca de cómo 
encaja la emoción dentro del modelo multicomponente de memoria de trabajo. 


CAPÍTULO 15 


Memoria de trabajo y emoción II 


Depresión y la fuente de la acción 


Como vimos en el capítulo anterior, parece existir un gran acuerdo respecto a 
cómo la memoria de trabajo se ve interrumpida por la ansiedad. Un sistema de 
avisos basado de manera evolucionista es Capaz de detectar fuentes potenciales 
de amenaza, a menudo de forma preatencional, dando lugar a una interrupción 
de los procesos de pensamiento en curso. Aunque disponer de un sistema de 
monitorización como este es claramente valioso, cuando el umbral es demasiado 
bajo, como ocurre en el trastorno de ansiedad generalizada (TAG), o cuando a 
causa de un aprendizaje inapropiado un estímulo previamente neutral se recubre 
de características que provocan ansiedad, como ocurre en el caso de las fobias, el 
sistema puede funcionar mal, creando problemas importantes para la cognición 
diaria. Como hemos visto, la atención también se puede interrumpir, y el 
procesamiento cognitivo también se puede acelerar mediante estímulos 
apetitivos, siempre que estos sean lo suficientemente fuertes, como el deseo de 
comer cuando estás a dieta, o las drogas en el caso de un drogadicto. Aunque 
estos descubrimientos no apoyen de forma específica al modelo de memoria de 
trabajo multicomponente, sí se ajustan cuidadosamente a este sistema, y en el 
estudio de Kavanagh et al. (2005) acerca del deseo y del anhelo, sí estaban 
directamente influidos por el modelo. Mi primera suposición era que la 
interrupción cognitiva que aparece con la depresión podría ajustarse también al 
mismo patrón. De hecho se da el caso de que la ansiedad y la depresión aparecen 
frecuentemente de forma conjunta (Mogg y Bradley, 2005). Por supuesto, esto 
no significa necesariamente que tengan un mecanismo común o que estén 
casualmente unidos. 


15.1. Comparando los efectos de la ansiedad y la depresión 


Los efectos de la ansiedad tal como se reflejan en el TAG se pueden resumir así: 
la ansiedad tiene un impacto mayor sobre la atención, tanto a nivel preconsciente 
como consciente (Óhman y Soares, 1994). Tiende a estar externamente 
focalizada sobre fuentes potenciales de amenaza. Proporciona energía, 
supuestamente para preparar al organismo para la lucha o para el vuelo. Por ello, 
su valor evolucionista es claro. Finalmente, posee un impacto relativamente 
pequeño sobre la memoria a largo plazo, excepto bajo condiciones extremas 
como en el caso del trastorno de estrés postraumático en el que puede dar lugar a 
memorias muy vívidas e intrusivas. ¿Hasta qué punto la depresión comparte 
estas características? 


La depresión parece tener un efecto menor sobre la atención que la ansiedad, con 
escasa evidencia de un efecto preatencional. A diferencia de la ansiedad, la 
depresión tiende a estar internamente focalizada, siendo un rasgo prominente las 
rumiaciones sobre pensamientos negativos, y es apaciguante, tendiendo a 
originar apatía en lugar de acción (Nolen-Hoeksema et al. , 1993; Pyszynski y 
Greenberg 1987). Sin embargo, la depresión influye en la memoria a largo plazo 
en mayor medida que la ansiedad. Finalmente, su valor evolucionista no es 
demasiado obvio, aunque se han propuesto una gran cantidad de explicaciones 
evolucionistas. Estas diferencias, que se resumen en la Tabla 15.1, serán 
discutidas por orden. 


Tabla 15.1. Resumen de las diferencias más importantes entre ansiedad y 
depresión 
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15.1.1. Atención y depresión 


Como vimos en el capítulo anterior, mucha de la influencia de la ansiedad sobre 
la cognición proviene de su impacto sobre procesos atencionales y 
preatencionales que dan lugar a la interrupción del control ejecutivo. Aunque 
existen algunas evidencias de la interrupción atencional en la depresión, sus 
efectos parecen ser menos marcados, por lo que Williams et al. (1997) sugirieron 
que, en contraste con el patrón de descubrimientos procedentes de los estudios 
con ansiedad, la depresión no tiene un efecto importante sobre la atención. 


Una perspectiva ligeramente diferente es la adoptada por Gotlib y colegas, 
quienes han obtenido pruebas de un sesgo atencional en pacientes depresivos 
gracias a una serie de estudios. En un experimento, Gotlib et al. (2004a) 
presentaron caras tristes, caras de rabia y caras neutras durante 1.000 
milisegundos, a sujetos control y a pacientes que sufrían depresión, o bien un 
TAG. Los pacientes depresivos dirigieron más su atención hacia las caras tristes, 
en contraste con un estudio previo de Mogg et al. (2000) en el que se empleó una 
exposición más corta, de 500 milisegundos, y en donde no se encontró ningún 
efecto. En un estudio posterior (Gotlib et al. , 2004b) no se encontró efecto de la 
depresión sobre la atención, medida a través del rendimiento en la tarea del 
Stroop emocional, pero sí observaron un sesgo atencional hacia las caras tristes 
en pacientes depresivos, junto con un sesgo de memoria negativo. Sin embargo, 
la memoria y los efectos atencionales no correlacionaban, un resultado que ellos 
interpretaron como un apoyo a la distinción entre los efectos de la atención sobre 
la ansiedad y la depresión propuestos por Williams et al. (1997), en vez de la 
visión unitaria de Beck (1976) y Bower (1981). Gotlib et al. propusieron 
distinguir entre el efecto pre-atencional de la ansiedad sobre la atención que es 
detectable incluso cuando se presentan subliminalmente estímulos amenazantes 
y un sesgo postatencional hacia estímulos de cierta relevancia emocional que 
también puede aparecer con la depresión. Esto requiere una mayor exposición a 
los estímulos y se podría dar tanto en pacientes con un TAG como en pacientes 
depresivos. 


Mogg y Bradley (2005) llegan a una conclusión ampliamente similar en una 
revisión reciente sobre estudios de depresión y TAG, concentrándose en tareas 


atencionales frecuentemente usadas —el Stroop emocional y un sondeo visual-, 
como se describe en el capítulo anterior. Ellos identifican diez estudios sobre 
rendimiento en sujetos con TAG en el Stroop emocional desenmascarado, de los 
cuales todos mostraron el sesgo predicho. De los nueve estudios equivalentes 
con depresivos, solo cuatro mostraron el efecto. Tres de ellos consistían en 
material negativo relacionado con ellos mismos. Los autores solo informan de 
dos experimentos con el Stroop emocional enmascarado, comparando pacientes 
con TAG y pacientes depresivos. Los dos experimentos mostraron un sesgo en 
los pacientes ansiosos pero no en los depresivos. Un patrón ampliamente similar 
emergió para la tarea del sondeo visual, en donde 10 de los 12 estudios de 
ansiedad mostraron la presencia del efecto, en comparación con 2 de los 11 que 
lo mostraron en el caso de la depresión. 


Esta clara distribución es particularmente chocante, dado que los pacientes con 
TAG y los depresivos poseen una alta tasa de comorbilidad clínica. En un 
estudio clínico, dos tercios de los pacientes diagnosticados con depresión mayor 
también fueron diagnosticados con ansiedad, y un tercio de los pacientes con 
TAG también fueron diagnosticados con depresión (Brown et al. , 2001). De 
hecho los pacientes del estudio de Mogg et al. que comparaba la depresión con 
el TAG, también tuvieron un nivel de ansiedad equivalente, tan solo 
diferenciándose en si también eran depresivos o no (Bradley et al. , 1995; Mogg 
et al. , 1993; 2000). ¿Entonces por qué los pacientes depresivos no mostraban un 
efecto sesgado, si eran tan ansiosos como los pacientes con TAG que sí lo 
mostraban? Mogg y Bradley (2005) consideran y rechazan una serie de 
explicaciones posibles, optando por un déficit motivacional relacionado con la 
depresión, proponiendo que de hecho tanto los pacientes depresivos como los 
ansiosos están sesgados hacia estímulos negativos, pero las «respuestas de 
compromiso con una meta» son relativamente indiferentes en la depresión. 


Apuntan que el enfoque de Williams et al. (1997) podría sostenerse si se asume 
una diferencia entre un foco externo para posibles fuentes de amenaza en 
pacientes con TAG frente a un foco interno en pacientes depresivos. Sin 
embargo, rechazan esto sobre la base de que podría dar lugar a sesgos centrados 
tanto interna como externamente. Este argumento no me convence del todo. Si la 
principal fuente de amenaza para los pacientes depresivos está internamente 
representada, por ejemplo, un reto para su ya bajo sentimiento de valía propia, 
entonces bien podría generar una ansiedad que estuviera fuertemente asociada 
con el mundo interno del paciente, más que con los indicios externos empleados 
por el experimentador. Consistente con esta interpretación es el hecho de que 


estímulos autodescriptivos negativos, que presumiblemente reflejan un foco 
interno, son característicos de tres de los seis estudios que muestran efectos 
sesgados en pacientes depresivos, en comparación con solo una de las 20 
demostraciones de este sesgo en pacientes con TAG. 


En conclusión, aunque los pormenores siguen siendo controvertidos, parece 
existir un acuerdo entre Williams et al. (1996), Gotlib et al. (2004a, b) y Mogg y 
Bradley (2005) sobre la necesidad de mantener una distinción entre los robustos 
y preatencionales efectos del TAG sobre la atención y los efectos del sesgo 
postatencional mucho más débiles que algunas veces presentan los pacientes 
depresivos. 


15.1.2. Interrupción de la memoria por depresión 


A menudo los pacientes deprimidos se quejan de problemas de memoria en el 
día a día (Blaney, 1986; Watts, 1993). También existe evidencia objetiva de un 
aprendizaje pobre en estos pacientes. En un estudio clásico de Cronholm y 
Ottosson (1961) se estudió la capacidad de pacientes depresivos y de sujetos 
control para aprender y recordar fragmentos en prosa y pares de palabras y 
formas; encontraron un claro déficit en los pacientes. Rude et al. (1999) usaron 
un estudio experimental análogo sobre memoria prospectiva en el que se pedía a 
los pacientes que recordaran que luego debían realizar una acción; también 
encontraron que el rendimiento se deterioraba con la depresión. Los pacientes 
depresivos se quejan frecuentemente de problemas de memoria, y la incidencia 
de la queja suele correlacionar con el nivel de depresión (Scogin et al. , 1985). 
Sin embargo, en un estudio de Kahn et al. (1975) se encontró que, aunque la 
frecuencia de las quejas de memoria de los pacientes correlacionaba con el nivel 
de depresión, el nivel de la queja no correlacionaba con medidas objetivas de 
rendimiento en memoria. 


¿Por qué la depresión interfiere con el aprendizaje y la memoria? Ellis y 
Ashbrook (1988) ofrecen una interpretación que denominan Modelo de 
Asignación de Recursos (MAR), que es algo similar a la hipótesis de la 
preocupación propuesta para explicar la interrupción del rendimiento por la 
ansiedad. Ellos proponen que los pensamientos depresivos intrusivos absorben la 


capacidad de procesamiento limitada de los pacientes, lo que interrumpe el 
aprendizaje. Un enfoque alternativo lo proponen Hertel y Hardin (1990), quienes 
sugieren que los pacientes depresivos tienen una simple falta de iniciativa y, por 
tanto, no tienden a usar estrategias activas para acentuar su rendimiento. 
Evidencia consistente con esta interpretación proviene de una serie de estudios 
que han mostrado una interacción entre los efectos de la depresión y la 
naturaleza del material de aprendizaje. Por ejemplo, Weingartner et al. (1981) 
encontraron un déficit depresivo para listas de palabras no estructuradas, que 
desaparecía cuando se proporcionaba una estructura a la lista; presumiblemente, 
la falta de estructura demanda una iniciativa al imponer una organización que es 
necesaria para el aprendizaje (Tulving, 1962; Mandler, 1967). De forma similar, 
Potts et al. (1989) encontraron que al proporcionar material con posibilidad de 
realizar sobre él elaboraciones activas, se beneficiaba a los sujetos control más 
que a los pacientes depresivos, y Hertel y Rude (1991) encontraron que 
proporcionar una estructura clara dentro del material eliminaba la desventaja 
previamente mostrada por los sujetos depresivos. 


La hipótesis inicial de Hertel parece demandar un tipo de concepto dinámico, tal 
como el concepto de energía mental, un concepto que lamentablemente parece 
haber desaparecido de la psicología cognitiva, a pesar de los esfuerzos de 
Broadbent (1971) y Kahneman (1973) para acentuar su importancia. Esta 
explicación del deterioro general en el aprendizaje y en la memoria como 
resultado del agotamiento de la energía contrasta con el modelo de asignación de 
recursos de Ellis, que se asemeja a la hipótesis de la preocupación al postular lo 
que efectivamente es un efecto de distracción cognitivo. Estas interpretaciones 
en competición están presumiblemente abiertas a examen a través de algunas de 
las técnicas previamente descritas usadas para investigar la hipótesis de la 
preocupación (Calvo y Eysenck, 1996; Derakshan y Eysenck, 1998), donde 
presumiblemente el modelo de Ellis elaboraría predicciones diferentes a las de la 
hipótesis de la falta de iniciativa de Hertel. Hasta donde yo sé, estas líneas de 
investigación no han sido exploradas todavía. 


15.1.3. Memoria para material emocional 


Quizá el rasgo más intensamente estudiado de la memoria y la depresión sea el 


efecto de congruencia del estado de ánimo, por el que un estado de ánimo 
depresivo facilita la recuperación de memorias negativas. El efecto de 
congruencia con el estado de ánimo es clínicamente importante porque también 
se aplica a la accesibilidad de las memorias autobiográficas. La depresión se 
incrementa sesgando el recuerdo hacia aquellas memorias con un tono negativo, 
lo que crea una espiral. Teasdale et al. (1980) manipularon el estado de ánimo de 
sus estudiantes usando la técnica Velten (1968) que incita a los sujetos a sentirse 
de forma consistente con una serie de frases que tienen que leer mostrando 
empatía. Las frases varían desde un tono suave: «Las cosas no van justo como a 
mí me gustaría», a frases muy depresivas: «Si miro atrás en mi vida me pregunto 
si he logrado algo que merezca verdaderamente la pena.» Entre las frases que 
inducían un estado positivo se incluían: «En general estoy muy contento con la 
forma en que me van las cosas» y «La vida es tan completa y tan interesante que 
¡es genial estar vivo!» La técnica parece funcionar, si medimos el autoinforme 
subjetivo así como medidas objetivas tales como la velocidad de escritura y la 
tasa de habla (Clark, 1983a). 


Cuando se pide que recuerden experiencias agradables y desagradables, y que 
digan el primer recuerdo que les viene a la cabeza, un estado de ánimo feliz 
facilita los recuerdos felices y viceversa, un resultado que ha sido replicado por 
una serie de investigadores (Coger, 1981; Madigan y Bollenbach, 1982; Zinder y 
White, 1982). Efectos similares se han encontrado usando pacientes con 
fluctuaciones diurnas del estado de ánimo, encontrando que los recuerdos 
infelices son más probables de recordar bajo altos niveles de depresión (Clark y 
Teasdale, 1982), un resultado que se replicó usando pacientes depresivos más 
típicos (Clark y Teasdale, 1985). Este patrón contrasta con el de sujetos normales 
que tienden a tener un sesgo positivo en sus recuerdos bajo condiciones de línea 
base (Blaney, 1986). 


Es importante apuntar que los robustos efectos del estado de ánimo congruente 
dependen de que el material a recordar tenga un tono emocional, en contraste 
con los efectos de la dependencia del estado de ánimo, en los que el recuerdo de 
palabras neutras se ve acentuado cuando el estado emocional durante el 
aprendizaje se reinstaura en el recuerdo, un fenómeno mucho menos robusto 
(Bower et al. , 1981; Schare et al. , 1984). Sin embargo, la dependencia del 
estado de ánimo aparece algunas veces cuando las palabras neutras son 
autorreferentes (Gotlib y Hammen, 1992; Williams y Scout, 1988). Es 
interesante apuntar que las escasas demostraciones de sesgo atencional en la 
depresión se consiguen principalmente usando materiales autorreferentes. 


15.1.4. Depresión y autoevaluación 


Otro rasgo de la depresión es su impacto negativo sobre la evaluación de uno 
mismo y del mundo, y el impacto resultante que tiene sobre la acción y la 
elección. Una serie de estudios han examinado esto experimentalmente, 
induciendo estados de ánimo infelices, neutros o felices en sujetos normales. 
Estados de ánimo bajos dan lugar a una reducción de la satisfacción por la vida 
en general (Schwarz y Clore, 1983; Schwarz et al. , 1987), y del nivel de 
habilidades sociales de uno mismo (Forgas et al., 1984). Un estado de ánimo 
depresivo lleva a considerar empresas futuras como más arriesgadas (Johnson y 
Tversky, 1983), y a atribuirse los fallos pasados a la incompetencia de uno 
mismo (Forgas et al. , 1990). Schwarz y Clore (1983) investigaron el efecto del 
tiempo climatológico sobre estimaciones del grado de satisfacción por la vida. 
Se telefoneó a los sujetos durante un día soleado o lluvioso, y se les preguntó por 
su nivel de satisfacción general por la vida. Los días más soleados dieron lugar a 
una estimación consistentemente más elevada, un efecto que desaparecía si 
primero se les preguntaba por el tiempo. Parece, por tanto, que estas fuentes 
implícitas del estado de ánimo se pueden evitar si se hacen explícitas. En otro 
experimento, Schwarz y Clore (1983) indujeron a sus sujetos un cierto estado de 
ánimo pidiendo que recordaran un suceso positivo o negativo. De nuevo esto 
influyó en la valoración posterior de sus sujetos acerca de su nivel de 
satisfacción por la vida. Sin embargo, este efecto no apareció en un grupo al que 
primero se le preguntó explícitamente cómo les había hecho sentir el recuerdo, 
antes de pedirles que estimaran su grado de satisfacción con la vida. Parece que 
los efectos del estado de ánimo se pueden evitar, siempre que seamos 
conscientes de ellos. 


Los efectos negativos del estado de ánimo no son específicos del contexto en 
que se induce la melancolía. Johnson y Tversky (1983) encontraron que el riesgo 
estimado de morir de cáncer se incrementaba lo mismo después de escuchar una 
historia acerca de una muerte por incendio que la historia de una muerte por 
cáncer. De forma similar Kavanagh y Bower (1985) encontraron que imaginar 
un fracaso romántico reducía la probabilidad estimada de los sujetos de salir con 
éxito de un enfrentamiento con una serpiente, de la misma forma que se reducía 
la probabilidad de divertirse en los próximos diez días. 


El estado de ánimo también influye en la interpretación de los sucesos que han 
ocurrido. Forgas et al. (1990) usaron una película de vídeo para inducir felicidad, 
tristeza o un estado de ánimo neutro, y después preguntaron a los sujetos sobre 
las pruebas previas, pidiéndoles que atribuyeran su resultado a su habilidad, a su 
esfuerzo, su suerte, o bien a factores situacionales, y después que hicieran un 
juicio equivalente sobre un estudiante típico. En la condición de felicidad, los 
sujetos asumían que tanto ellos como el estudiante típico eran más responsables 
de los éxitos que de los fallos. Sin embargo, cuando se inducía un estado de 
ánimo negativo, los sujetos tendían a inculparse ellos mismos de los fallos, pero 
no aplicaban estos duros juicios a los fallos cometidos por el estudiante típico, de 
forma consistente a lo que ocurre con la depresión previamente discutida, que 
dirige la atención hacia uno mismo y sus propias limitaciones. 


15.1.5. Pensamientos negativos y rumiaciones 


Tal como se esperaría a partir de la evidencia sobre los efectos de la dependencia 
del estado de ánimo, los pacientes con rumiaciones tienden a tener depresiones 
más prolongadas (Nolen-Hoeksema, 1991). En un estudio con estudiantes en el 
que respondían a un desastre natural, concretamente un terremoto, Nolan- 
Hoeksema y Morrow (1991) encontraron que los estudiantes con un estilo 
rumiativo tenían una probabilidad significativamente mayor de ser depresivos 
diez días y siete semanas después del suceso, independientemente de su nivel 
inicial de depresión. Fennell et al. (1987) estudiaron la tendencia de sujetos 
deprimidos y sujetos control a generar pensamientos depresivos espontáneos. Se 
pedía a los sujetos que describieran, o bien una serie de dibujos mostrados en 
láminas, o simplemente que miraran un rayo de luz. De vez en cuando se les 
preguntaba por sus pensamientos y su nivel de depresión, nivel que también se 
medía a través de la velocidad de movimiento. Cuando observaban el rayo de 
luz, los pensamientos depresivos aparecían un 56 por ciento de las veces y 
normalmente eran independientes de los estímulos o de los alrededores. Cuando 
se les daba una tarea potencialmente distractora, como describir los dibujos, los 
pensamientos se reducían a un 10 por ciento. Esta actividad también reducía los 
niveles de depresión medidos a través de autoinformes y de velocidad motora, 
sugiriendo que el estado depresivo necesita mantenerse, y por tanto se puede 
interrumpir con actividades. Esto es consistente con nuestras investigaciones 


acerca de pensamientos independientes del estímulo en sujetos no depresivos, 
descritas en el capítulo anterior, que implicaban al ejecutivo central de la 
memoria de trabajo como componente crucial para la prevención y la 
interrupción de estas rumiaciones (Teasdale et al. , 1993; 1995). 


En resumen, la depresión tiene menos efecto sobre la atención que la ansiedad, 
pero a menudo se ve acompañada por quejas de una pobre memoria. Esto parece 
reflejar una falta de iniciativa durante el aprendizaje, más que un déficit de 
memoria directo. El recuerdo a partir de la memoria a largo plazo está influido 
por la congruencia con el estado de ánimo, el cual tiende a prolongar las 
rumiaciones, deprimiendo aún más e influyendo de forma negativa sobre la 
evaluación de la situación presente y de los planes futuros. 


15.2. Teorías psicológicas de la depresión 


Las interpretaciones psicológicas de la depresión tienden a encuadrarse dentro de 
cuatro amplias categorías, concretamente la psicoanalítica, la conductual, basada 
en el control, y la cognitiva, cada una acentuando una faceta distinta del 
problema. Los enfoques psicoanalíticos proceden de la sugerencia de Freud 
(1917/1986) de que la depresión se origina cuando la rabia, movida por la 
pérdida o el sufrimiento, se vuelve hacia el interior del paciente. Las teorías 
conductuales tienden a atribuir la depresión a una baja tasa de refuerzo social 
que da lugar al abandono y a la inactividad, y que está potencialmente reforzada 
por la compasión de los amigos y de la familia (Coyne, 1976; Lewinsohn, 1975). 
El enfoque de la teoría de control se relaciona también con permanecer 
encerrado en un bucle de retroalimentación adecuado, siendo la indefensión 
aprendida un ejemplo influyente. Cuando un animal o una persona, 
independientemente de la acción que tomen, se enfrentan a consecuencias 
negativas que ocurren sin poderlos predecir, adoptarán una respuesta de 
pasividad e indefensión hacia el problema aparentemente irresoluble, una 
respuesta que se refleja en la depresión (Seligman, 1975). Como se ha 
cuestionado si la versión original era un modelo adecuado para la depresión 
humana, se han desarrollado otras formas de la teoría de control (Abrahamson et 
al., 1978; Pyszcynski y Greenberg, 1987). Sin embargo, el enfoque teórico más 
influyente en los últimos años ha sido la teoría cognitiva de la depresión de Beck 


(1976). 


La teoría de Beck se basaba principalmente en la observación clínica, y proponía 
que la depresión se compone de tres componentes. El primero de ellos es la 
presencia de pensamientos automáticos, pensamientos que aparecen de forma 
inesperada tras un suceso y que a menudo se aceptan sin ser cuestionados. Es 
significativa la semejanza entre estos pensamientos y los que aparecen 
inesperadamente en el anhelo, como se discutió en el último capítulo. La 
naturaleza negativa de estos pensamientos inesperados tiende a entorpecer al 
estado de ánimo, causando una espiral de pensamientos elaborados. Esta espiral 
constituye la segunda parte del modelo, e implica una visión negativa de uno 
mismo (e.g., «Soy un fracasado»), del mundo que nos rodea («Este lugar se está 
yendo al garete») y del futuro («Las cosas están empeorando»). Todo va 
acompañado de errores lógicos sistemáticos (e.g., si un amigo no te ha 
telefoneado lo malinterpretan como un enfado), de generalizaciones («He 
perdido a este amigo, siempre pierdo a mis amigos»), pensamientos del tipo todo 
es blanco o negro («Como pierda a este amigo me puedo morir») y muchos 
otros. Un tercer y crucial componente es la presencia de esquemas depresivos, 
supuestos persistentes sobre el mundo y la forma en que está estructurado y que 
se relacionan con uno mismo. Estos supuestos son destructivamente negativos, y 
Beck supone que se adquieren durante la infancia. La clave de su teoría reside en 
el estatus casual que él asigna a estos esquemas negativos de larga duración. 


El enfoque de Beck ha sido extremadamente influyente a través de su posterior 
desarrollo de la terapia cognitiva para la depresión, en la que los pacientes son 
animados a identificar sus creencias negativas, a ponerlas a prueba y, a su debido 
tiempo, a desarrollar formas de evitar caer en el pozo de la depresión, y construir 
una representación de ellos mismos menos negativa (Beck, 1976). Sin embargo, 
aunque no hay duda de que el trabajo de Beck ha dado lugar a una mejora 
importante en el tratamiento de la depresión, la teoría subyacente se topa con una 
serie de dificultades: 


1. Hay evidencia que sugiere que las creencias disfuncionales negativas pueden 
ser una consecuencia, más que una causa, de la depresión, ya que tienden a 
cambiar cuando los pacientes se recuperan (Simona et al. , 1984) incluso cuando 
el tratamiento se centra en la conducta y no en la cognición (Imber et al. , 1990; 
Rehm et al. , 1987). 


2. Las actitudes que presumiblemente siguen basándose en esquemas 
subyacentes disfuncionales parecen normalizarse cuando los pacientes 
depresivos se recuperan (Teasdale, 1988). 


3. La teoría dice muy poco acerca de la importancia de los factores sociales y 
ambientales como causa de la depresión (Brown y Harris, 1978; Coyne y Gotlib, 
1983). 


4. La teoría también ignora la importancia de factores genéticos y biológicos, tal 
como se refleja, por ejemplo, en las fluctuaciones diurnas o estacionales de los 
niveles de depresión, o en los efectos de los tratamientos farmacológicos. 


5. La teoría ignora la distinción entre cognición «fría» y «caliente». Los 
pacientes puede que sepan que sus enfoques son irracionales, y que 
verdaderamente ellos no son tan desesperadamente impropios, pero sin embargo 
no sienten que esto sea así. 


La diferencia entre dos niveles de procesamiento cognitivo reside en el corazón 
del modelo de los Subsistemas Cognitivos Interactivos (SCI) del procesamiento 
cognitivo de Barnard (1999). El modelo se desarrolló originariamente para dar 
cuenta del procesamiento del lenguaje (Barnard, 1985), después se aplicó a la 
interacción hombre-máquina y posteriormente, en colaboración con Teasdale, se 
desarrolló para proporcionar una explicación de la depresión (Teasdale y 
Barnard, 1993). El modelo SCI es algo complejo, y se podría decir que contiene 
dentro de sí mismo una forma de memoria de trabajo multicomponente, 
especificada con cierto detalle, que de hecho puede localizarse en mi propio 
modelo. El ejecutivo central está dividido en dos, el sistema proposicional y el 
implicacional. El sistema proposicional está abierto a la conciencia y es 
responsable de la cognición explícita y «fría», relativamente libre de emociones. 
Este sistema está unido al segundo componente, el sistema implicacional, que es 
responsable de la cognición «en caliente», y que, entre otras cosas, está unido a 
los indicios corporales asociados con la emoción. Yo diría que esta distinción es 
necesaria, y su ausencia en el actual modelo multicomponente de memoria de 
trabajo reflejaría una clara limitación en cuanto al alcance del modelo. 


Sin embargo, tengo ciertas reservas en relación con el modelo SCI. En primer 
lugar, asume una estructura equivalente para todos los subsistemas sensoriales 


periféricos. Puedo admitir que quizá esto suponga una solución computacional 
elegante, pero no es una solución que contemple con detalle la evidencia 
empírica que distingue por ejemplo entre el bucle fonológico y la agenda, y no 
parece haber originado una mejor comprensión del funcionamiento de estos 
subsistemas. Un segundo problema tiene que ver con la complejidad. Con tantos 
componentes, cada uno funcionando en distintos niveles, e interaccionando unos 
con otros, es difícil tener una comprensión clara de cómo funciona el modelo 
exactamente. De hecho probablemente solo se puedan hacer predicciones 
ejecutando el modelo, que a su vez requerirá muchos supuestos sobre los 
parámetros, y una experiencia computacional considerablemente mayor que la 
mía, o sospecho, que mayor que la que poseen muchos usuarios potenciales del 
modelo. 


Sugiero un modelo que quizá comparta el espíritu del SCI, pero es mucho más 
simple. El modelo es consistente con el espíritu de las observaciones de Beck, 
pero no acepta su supuesto de la primacía de los esquemas negativos. Es un 
modelo compatible con la influencia de los factores neurobiológicos y 
farmacológicos, y está asociado con una explicación plausible de la importancia 
evolucionista de la depresión. Finalmente, aunque creo que supone una 
formulación nueva, resaltaría que la mayoría de sus componentes ya forman 
parte de otros enfoques sobre la cognición y la emoción. 


15.3. La fuente de la acción 


Una diferencia crucial entre el miedo y la depresión es que el miedo proporciona 
energía y la depresión apatía. Para comprender esta diferencia, necesitamos una 
teoría de la motivación, y de su capacidad para dirigir y controlar la conducta. 
Como apuntamos anteriormente, esta ha sido un área de la psicología cognitiva 
ignorada desde que el concepto del arousal pasó de moda en 1970, en parte al 
menos por la dificultad de progresar un poco más allá de lo que podría ser una 
simple medida del estado general de alerta del sistema. El miedo, la lujuria y los 
nervios al asistir a una buena competición deportiva se asocian probablemente 
con altos niveles de arousal, pero también se diferencian de forma importante. Es 
más, dado un nivel de arousal moderado, la teoría no nos dice por qué elegimos 
hacer una cosa en lugar de otra —en resumen, no es una teoría de la motivación—. 


Si la psicología cognitiva tiene que ofrecer una amplia explicación de la acción, 
entonces necesita combinar las teorías del procesamiento de la información y del 
control con una teoría de la motivación y la volición. 


15.3.1. Hipótesis del mundo cargado emocionalmente 


El problema de la volición fue claramente establecido hace unos 250 años por el 
gran filósofo empírico, David Hume. Su enfoque proporcionó un buen punto de 
partida, presentando una explicación lúcida de lo que sigue siendo la solución 
más probable, lo que yo denominaré la hipótesis del mundo cargado 
emocionalmente. Esta hipótesis asume que el mundo que percibimos y 
recordamos no es emocionalmente neutro, sino que sus características están 
cargadas con un tono positivo o negativo. Hume asegura que «La razón es y ha 
de ser la esclava de las pasiones, y nunca puede pretender ocupar otro cargo más 
que servir y obedecerlas» (Hume, 1739/1978, p. 415). Él propone que el 
mecanismo de control proviene de la capacidad de las emociones para reflejar 
«la posibilidad de dolor o de placer a partir de cualquier objeto...» (ibid. , p. 
414). El impulso resultante se suscita «no a partir de la razón, sino que solo está 
dirigido por ella». 


Hume continúa explicando, que por emoción entiende no solo las emociones 
extremas como la rabia, el miedo o el deseo, sugiriendo que «una vez más 
existen ciertos deseos serenos y propensiones que, aunque son pasiones reales, 
producen una escasa emoción mental, y se las conoce por sus efectos más que 
por sus sentimientos o sensaciones inmediatas» (ibid. , p. 407). Él cita como 
ejemplo la benevolencia y el resentimiento, el amor a la vida y la simpatía hacia 
los niños pequeños, las cuales describe como emociones que la razón puede 
confundir fácilmente. Contrapone estas «calladas pasiones» con pasiones más 
violentas como el deseo de castigar a alguien que te haya hecho daño, 
atribuyendo la fortaleza mental a la «prevalencia de las pasiones sosegadas sobre 
las violentas» ( ibid., p. 418). Finalmente, señala que la complejidad de esta serie 
de pasiones puede dificultar la elección del camino correcto, concluyendo que 
«de estas variaciones del temperamento procede la enorme dificultad de decisión 
en relación con las acciones y resoluciones de los hombres cuando existen 
emociones y pasiones en contra» ( ibid., p. 418). 


En resumen, Hume propone que nuestras acciones están determinadas por 
nuestros deseos, tanto positivos como negativos, tal como se refleja en el mundo 
que nos rodea. Señala que es posible que no las sintamos como emociones 
fuertes, y que la fuerza de la mente o el autocontrol refleja la capacidad para 
permitir que las emociones positivas aunque débiles sean desbordadas por 
emociones más incontrolables. Como filósofo del siglo dieciocho, Hume se vio 
obligado a confiar en su propio juicio e introspección. La cantidad de evidencia 
empírica que se ha acumulado sobre este tema en los últimos dos siglos no es 
sorprendente, pero creo que tendería a apoyar el enfoque de Hume. 


A pesar de su importancia, la cuestión de qué es lo que dirige la conducta ha 
estado sustancialmente ignorada durante muchos años por la psicologia 
cognitiva y la neuropsicología cognitiva, una ignorancia que por fortuna está 
empezando a remediarse. Este reavivado interés se ha visto fuertemente influido 
por el trabajo de Antonio Damasio (1994), quien abordó este tema en su libro El 
error de Descartes. El libro comienza considerando el clásico caso de Phineas 
Gage, un encargado del ferrocarril del siglo diecinueve que tuvo la mala suerte 
de verse involucrado en un accidente en el que un afilado pincho se clavó en su 
cuenca ocular y en el lóbulo frontal de su cerebro. Se recuperó bastante bien de 
este terrible suceso, que apenas dañó su capacidad intelectual, pero sí le produjo 
un profundo cambio en su personalidad. Un informe del médico que lo atendió 
(Harlow, 1868) describe su transformación como «alguien con una mente 
equilibrada... un hombre de negocios astuto e inteligente, muy activo y 
persistente» que se convirtió en «irregular, irreverente... impaciente y sin 
compostura o mesura cuando sus deseos entran en conflicto, en ocasiones 
pertinaz y obstinado, incluso caprichoso y vacilante», en resumen, «Gage ya no 
era el mismo Gage» (Harlow, 1868, citado en Damasio, 1994, p. 8). 


Aunque Gage es el ejemplo más conocido de un caso como este, por supuesto no 
es el único. Damasio describe uno de sus propios pacientes, Elliot, un hombre de 
negocios muy exitoso que tras extirparle un tumor cerebral en su lóbulo frontal 
presentó un patrón de comportamiento bastante parecido al de Gage. 
Intelectualmente seguía siendo muy capaz, pasando una serie de pruebas 
neuropsicológicas con aparente facilidad. Conservaba todas sus habilidades 
sociales y de lenguaje y había regresado a su trabajo, pero con un resultado 
desastroso. Parecía haber perdido todo su anterior buen juicio, y había fracasado 
en sucesivos trabajos y en las relaciones personales. ¿Por qué? Para comprender 
esta cuestión, Damasio propuso su hipótesis de los marcadores somáticos, que 
tenía mucho en común con el enfoque anterior de Hume, aunque respaldado por 


la amplia evidencia neuropsicológica de Damasio y por un mecanismo 
neuroanatómico. Para el propósito actual, sin embargo, nos centraremos en las 
implicaciones de la hipótesis a nivel psicológico. 


Damasio comienza como Hume, enfatizando la importancia de las emociones 
para dirigir y guiar la conducta. También acentuó la importancia de lo que Hume 
denomina «las pasiones calmadas». Damasio hace una distinción entre las 
emociones, definidas en función de su carácter somático o corporal y los 
sentimientos, que son el equivalente conscientemente detectable. La hipótesis de 
los marcadores somáticos propone que son estos sentimientos los que guían la 
acción, sirviendo como campanas de alertas negativas o positivas «señales de 
incentivos». Propone que «los marcadores somáticos son un ejemplo especial de 
sentimientos generados a partir de emociones secundarias... conectados 
mediante el aprendizaje para predecir los futuros resultados de ciertos 
escenarios» (Damasio, 1994, p. 174). 


Al igual que Hume, Damasio enfatiza la importancia del aprendizaje, sugiriendo 
que «un estado somático, positivo o negativo, causado por una representación 
dada, funciona no solo como marcador del valor de lo que se representa, sino 
también como refuerzo para la memoria de trabajo continua y la atención» ( 
ibid., pp. 197-198). Damasio enfatiza por tanto la importancia de mantener la 
conducta. Sigue desarrollando este punto, asegurando que «hay por tanto tres 
participantes secundarios en el proceso de razonamiento a lo largo del vasto 
panorama de escenarios generados a partir del conocimiento factual; los estados 
somáticos automáticos, con sus mecanismos de sesgo; la memoria de trabajo; y 
la atención» ( ibid., p. 198, énfasis del autor). De esta forma, Damasio otorga un 
gran peso a la importancia de la capacidad de almacenamiento de la memoria de 
trabajo y a su control atencional. 


Damasio interpreta por tanto la volición como la navegación por un mundo que 
comprende una serie de objetos y opciones, todos ellos bañados de sentimientos 
positivos o negativos, o con valencia. ¿Cuáles son las pruebas de este enfoque? 
Estas, cita Damasio (1994), son mayoritariamente neuropsicológicas. Sugiere 
que la falta de un marcador somático adecuado causará una incapacidad para 
usar la emoción cuando emitimos un juicio, acentuando la importancia de estas 
corazonadas intuitivas somáticamente basadas sobre una amplia serie de tareas, 
desde pequeños problemas como elegir la fecha para una reunión, hasta 
decisiones cruciales como con quién casarse. Él describe el caso de un paciente 
con un daño en el lóbulo frontal que había perdido esta capacidad, y al que se le 


sugirieron dos posibles fechas para su próxima visita. Cuando abrió su agenda, 
empezó a enumerar los posibles pros y contras de cada fecha, combinando y 
sopesando cada posibilidad durante cerca de media hora, hasta que finalmente 
Damasio le propuso un día, consiguiendo que respondiera «¡está bien!». 


Racionalmente, sopesar y combinar todas las posibilidades es, por supuesto, una 
actividad importante, y la incapacidad para hacer incluso una elección sencilla 
entre dos fechas sugiere una deficiencia potencial importante. ¿Qué procesos 
subyacen a esta capacidad? Existen dos necesidades obvias. Una implica la 
Capacidad para mantener y manipular información en la memoria de trabajo. La 
otra es un proceso de juicio hedónico que permite evaluar las características 
positivas y negativas de las distintas opciones. Sugiero que la depresión refleja el 
mal funcionamiento de esta detección hedónica y del sistema de evaluación. 


15.4. Memoria de trabajo y depresión 


La hipótesis del detector hedónico asume un sistema que es capaz de recoger 
asociaciones positivas o negativas de un objeto o de una representación dentro 
del búfer episódico de la memoria de trabajo. Se supone que es capaz de hacer 
un promedio de una serie compleja de estímulos para generar una suma rápida, 
de forma análoga al contador de Geiger orientado hacia un objeto o a una serie 
de objetos. A diferencia del contador de Geiger, sin embargo, supongo que es 
capaz de detectar valencias tanto positivas como negativas. Por tanto, puede 
evaluar situaciones complejas que comprenden una mezcla de características 
buenas y malas. Asumo que el sistema está controlado atencionalmente, por lo 
que puede evaluarse un solo objeto seleccionado o bien toda una serie de 
objetos. Por ejemplo, para decidirnos a la hora de comprar una casa, debemos 
tener una impresión general positiva, pero acompañada de ciertos sentimientos 
negativos. Considerando los aspectos de la casa por separado tenemos que ser 
capaces de decidir cómo son de importantes; por ejemplo, si lo que constituye el 
componente negativo es la decoración de la casa, que se puede cambiar 
fácilmente, o si se trata de unas vistas desagradables que no se pueden cambiar. 


El objeto de evaluación puede estar en el medio ambiente externo o estar 
internamente generado; en ambos casos estará en la memoria de trabajo. Esto 


permite comparar la casa que acabamos de ver con otra que hemos visto antes. 
Cuando las decisiones son complejas, puede que sea necesario centrarse en 
componentes específicos, o bien traer a la memoria de trabajo otras pruebas 
procedentes de la memoria a largo plazo. 


Es probable que este procesamiento ejecutivo sea demandante, requiriendo 
exactamente el tipo de multitarea que está deteriorada en los pacientes como los 
mencionados por Damasio (Shallice y Burgess, 1991; Burgess et al. , 2000). 
Mientras que muchas elecciones del día a día se hacen rápidamente, y 
posiblemente de forma automática, otras decisiones complejas, como qué casa 
comprar, es muy probable que dependan de la memoria de trabajo así como de la 
memoria a largo plazo. Estas decisiones son probablemente difíciles porque 
tienen una fuerte dependencia de la memoria de trabajo a la hora de procesar 
complejas series de estímulos que se deben evaluar, y cuyos resultados deben 
mantenerse mientras que se crean otras series de estímulos complejos para 
después comparar sus resultados. 


El sistema de evaluación hedónica propuesto tiene cinco rasgos cruciales, 
concretamente: 


1. El punto neutro de la escala con valencias positivas y negativas. 

2. Su sensibilidad, que es su capacidad para detectar cambios en ese nivel. 
3. Su capacidad para almacenar estos juicios. 

4. Su capacidad para discriminar entre esas opciones almacenadas. 


5. Su estabilidad. 


Puede que los individuos difieran en todos o en uno de estos rasgos. Si el punto 
neutro en el que la lectura se vuelve positiva se establece genéticamente a un 
nivel crónicamente alto, dará lugar a lo que se denomina un temperamento 
melancólico, como en el caso de un viejo amigo quien, tras darle la noticia 
aparentemente positiva de que había sacado una oposición, respondió: «¡Oh, 
dios, ya no podré dejarla nunca!» Lo contrario nos llevaría a alguien que es 


firmemente alegre y optimista. La insensibilidad es probable que nos lleve a un 
fallo de discriminación entre niveles hedónicos, y consecuentemente a 
problemas de ajuste social como los exhibidos por el paciente de Damasio, un 
déficit que podría resultar de un problema de evaluación hedónica, pero que en 
principio también podría deberse a un déficit ejecutivo, de almacenamiento o de 
procesamiento. Finalmente, la estabilidad del sistema puede variar entre 
individuos, dando lugar a una fluctuación del estado de ánimo a lo largo de 
intervalos cortos o largos. 


La aplicación de esta compleja guía hedónica probablemente sea particularmente 
difícil cuando se usa para evaluar planes de acciones futuras. Estos planes 
tendrán inevitablemente una falta de precisión, una falta de detalles 
hedónicamente fiables, que dificultan la evaluación comparativa. No es por tanto 
sorprendente que los pacientes con problemas en el lóbulo frontal tengan estas 
dificultades, dado que tienden a tener problemas importantes tanto en la 
generación de estrategias como en las multitareas (Shallice, 1988; Shallice y 
Burgess, 1991). Este efecto se ilustra en un estudio de Alderman (1996) 
relacionado con un programa de rehabilitación para pacientes con daños 
cerebrales y problemas conductuales mediante un sistema de economía de 
fichas. Este sistema consistía en ganar fichas, a partir de una conducta 
socialmente apropiada, que luego se podían canjear por privilegios. La mayoría 
de los pacientes se beneficiaron de este sistema, pero un grupo de ellos no. El 
déficit cognitivo más prominente en estos pacientes era una incapacidad para 
rendir en tareas dobles del estilo encontrado por Baddeley et al. (1997) en el que 
esta capacidad estaba deteriorada en el subgrupo de pacientes con daños en el 
lóbulo frontal, y que mostraban una conducta disejecutiva en su vida diaria. Es 
tentador sugerir que mantener una conducta social apropiada es en sí mismo una 
actividad de tarea doble, ya que es importante mantener tus propios objetivos 
mientras que tienes en mente los objetivos y necesidades de los otros. Nuestros 
resultados, sin embargo, simplemente podrían indicar que la tarea doble y la 
conducta social apropiada dependen de partes del cerebro que están 
anatómicamente juntas y, por tanto, que es probable que se vean lesionadas al 
mismo tiempo, aunque fueran funcionalmente distintas. 


Incluso personas saludables tienen dificultades para estimar el impacto hedónico 
de posibles cambios futuros. Esto fue estudiado por Gilbert et al. (1998), 
mediante experimentos de laboratorio y mediante un estudio de campo con 
profesores que estaban a punto de ocupar un puesto y en el que se les pedía que 
estimaran cómo se sentirían un año después de tomar la decisión, si sería 


positiva o negativa. Felizmente, aquellos que no consiguieron el puesto estaban 
mucho más contentos un año después de lo que habían anticipado, mientras que 
aquellos que sí obtuvieron el puesto estaban algo menos eufóricos de lo que 
esperaban. Gilbert et al. interpretaron sus resultados en términos de un fallo de 
inclusión en su decisión futura de una amplia serie de variables que influyen y 
median en la satisfacción de uno mismo por la vida, por encima de la decisión 
que constituye el foco de la estimación. 


Quizá también sea preciso destacar que parecemos estar equipados con 
formidables técnicas para defender nuestra autoestima de los golpes de fortuna. 
Esto incluye colgarse los laureles cuando se ha conseguido un éxito, y negar la 
responsabilidad de los fallos (Zuckerman, 1979), lo que lleva al olvido selectivo 
de los fracasos y a recordar los éxitos y los elogios (Crary, 1966; Mischel et al. , 
1976). Aceptamos los elogios fácilmente pero tendemos a ser escépticos con las 
críticas (Kunda, 1990; Wyer y Frey, 1983), a menudo atribuyendo las críticas a 
los prejuicios de quien critica (Crocker y Major, 1989). 


Dada esta formidable serie de estrategias para reafirmar nuestra autoestima, 
quizá no sea sorprendente que la percepción de nosotros mismos no tienda a 
correlacionar mucho con la visión que tienen de nosotros nuestros amigos y 
colegas. ¿Podría ser porque nosotros somos conscientes de nuestras virtudes 
internas que no esperamos que los demás perciban? Probablemente no, ya que 
solemos predecir erróneamente que es probable que sus concepciones se 
parezcan a las nuestras (Shrauger y Schoeneman, 1979). 


Taylor y Brown (1988) defienden que la tendencia a tener una visión de nosotros 
mismos de color de rosa es saludable. 


El individuo que ante una retroalimentación negativa, ambigua o contraria a un 
sentido positivo de sí mismo responde con confianza en la eficacia personal, y 
con una visión optimista del mundo, nosotros mantenemos que será más feliz, 
más comprensivo y más productivo que un individuo que recibe precisamente la 
misma información y la integra en su propia visión de sí mismo, del mundo y del 
futuro. 


(Taylor y Brown, 1999, p. 60) 


Aunque la convicción, del estilo a la de Micawber, de que todos estaremos bien, 
es difícil que sea una receta para lograr el éxito en un mundo complejo y no del 
todo benévolo, la ligera tendencia a mirar el lado bueno de las cosas es más 
potente que el sesgo contrario, el cual da lugar a la rumiación y a la inactividad 
en la depresión (Pyszynski y Greenberg, 1987). En resumen, un grado de sesgo 
positivo en el sistema de detección hedónica probablemente sea ventajoso. 


15.4.1. El detector hedónico y la depresión 


Sugiero que la depresión refleja un establecimiento inadecuado del punto neutro 
en el sistema de detección hedónica. Esto es probable que tenga dos efectos. El 
primero incluye la rumiación y la búsqueda de las causas de los afectos 
negativos. Esto dará lugar a una segunda consecuencia, el efecto pernicioso de la 
congruencia con el estado de ánimo, por el cual un estado de ánimo bajo 
conlleva un sesgo hacia las memorias negativas, acentuando por tanto la 
depresión. 


Se supone que el umbral hedónico se establece biológicamente, pero está 
influido por sucesos externos. Se supone que los pacientes con depresión 
endógena tienen un umbral crónicamente alto para detectar indicios de valencia 
positiva, por lo que en general evalúan el mundo de forma más negativa. 
Suponemos que esto está mediado neurofarmacológicamente y, por tanto, puede 
estar influido por terapias farmacológicas. El grado de estabilidad también puede 
variar entre individuos, quedándose el punto hedónico neutro como responsable 
de la fluctuación, bien diurnamente (Clark y Teasdale, 1982), o bien como base 
estacional, como ocurre en el trastorno afectivo estacional, aunque su rango 
también puede fluctuar desde un umbral de moderado a alto, como en la 
depresión unipolar, o desde muy alto hasta muy bajo, como en la manía 
depresiva (Bulbena y Berrios, 1993; Murphy et al. , 1999). 


La función del sistema hedónico es evaluar el medio, incluyendo experiencias 
pasadas y planes futuros. Cuando estos son negativos, la señal por supuesto 
tenderá a ser negativa, originando rumiaciones y una búsqueda de soluciones al 
problema. Si no hay solución, y todas las opciones son negativas, entonces se 
puede dar un estado de indefensión aprendida, que da lugar a una pasividad 


depresiva (Seligman, 1975). Si no existe una causa externa obvia, entonces el 
sistema buscará explicaciones internas, lo que probablemente lleve a 
autoinculparse, y la recuperación de esquemas propios negativos más que 
positivos llevará, como observó Beck, a una depresión mayor. 


¿Puede la hipótesis del detector hedónico explicar el grado de apatía que parece 
acompañar a la depresión de forma distinta que la hipótesis de la indefensión 
aprendida? Sugiero que sí puede. La hipótesis de la valencia hedónica propone 
que la acción positiva depende de lo que Damasio denomina «faros de 
incentivos». Si se percibiera que estos brillan con menos fuerza, los incentivos 
positivos descenderían progresivamente y con ellos la urgencia de actuar de 
forma constructiva. 


El tratamiento farmacológico de la depresión funciona presumiblemente 
restaurando el punto neutral de forma endógena, mientras que la terapia 
cognitiva funciona intentando romper la espiral de rumiaciones, ayudando al 
paciente a recuperar las memorias positivas en lugar de las negativas y poniendo 
a prueba y rechazando las interpretaciones inadecuadas negativas del mundo 
(Williams, 1984). Es probable que esto lleve más tiempo que el tratamiento con 
fármacos, pero tiene la ventaja de que equipa al paciente con estrategias para 
sobrellevar el futuro, reduciendo por tanto la tasa de recaídas (Teasdale et al. , 
2000). Combinando la terapia farmacológica con la psicológica se consigue el 
tratamiento más efectivo para las depresiones severas. 


15.5. Emoción y el modelo multicomponente 


Dado que la emoción parece influir en el funcionamiento de la memoria de 
trabajo multicomponente, ¿cómo encajaría dentro del modelo? Dado que el 
efecto de la ansiedad puede funcionar de forma preatencional, entonces tenemos 
que asumir un sistema de detección de amenazas que sea capaz de eludir la 
memoria de trabajo. Sin embargo, ya que la memoria de trabajo es 
probablemente una herramienta importante para evaluar las opciones y 
responder apropiadamente, hay una clara necesidad de tomar una segunda ruta 
que funcione a través de la memoria de trabajo, una solución con dos 
componentes que es enteramente consistente con el elegante trabajo 


neurobiológico de LeDoux (1996) y otros. 


Hemos sugerido que la depresión depende crucialmente de la detección hedónica 
y de un sistema de evaluación, y que esto, junto con la capacidad para mantener 
y manipular información con valencia hedónica, juega un papel central en la 
conciencia, y posiblemente también en la toma de decisiones implícita. Dentro 
del modelo actual, se supone que el ejecutivo central es un sistema atencional, 
sin capacidad de almacenamiento intrínseca, aunque ni el bucle ni la agenda 
parecerían estar bien equipados para manejar y manipular información 
valenciada. Dado que la valencia del estímulo o la situación probablemente 
dependen, al menos en parte, de la experiencia previa, junto con la capacidad de 
mantenimiento durante la toma de decisiones, el lugar obvio donde situar esto 
sería el búfer episódico. El modelo de memoria de trabajo modificado se muestra 
en la Fig. 15.1, en la que la información relacionada con la amenaza se muestra 
mediante flechas rojas, la información positiva mediante las amarillas y la 
información de valencia negativa mediante las azules. 


15.5.1. Desarrollando el modelo 


Si la simple hipótesis del detector hedónico se demuestra teóricamente fructífera, 
es importante idear un método que estudie su funcionamiento, preferiblemente 
uno que sea simple y robusto. ¿Qué opciones están disponibles? 


Ejecutivo 
central R 
| Bucle 
fonológico 
Detector 
hedónico 


Búfer 
episódico 


Memoria a largo plazo 


Fig. 15.1. Adaptación del modelo de memoria de trabajo de Baddeley Búfer 

(2000) para incluir el impacto de los episódico factores emocionales sobre la 

memoria de trabajo. Las flechas rojas indican la detección de la amenaza, las 
azules la valencia negativa y las amarillas la valencia positiva. 


Un método que ha dominado el campo en los últimos años es la Tarea de 
Apuestas de lowa (IGT) ( Iowa Gambling Task), inventada por Bechara et al. 
(1994; 1997) para poner a prueba la hipótesis de los marcadores somáticos de 
Damasio. Más adelante discutiremos esto con detalle, pero deberíamos apuntar 
que para el propósito presente, la tarea tiene dos desventajas. Primero, que es 
relativamente compleja, y segundo que está relacionada con adquirir y usar 
nuevas valencias, mientras que nuestra necesidad primaria es un método para 
medir el sistema que evalúa las valencias existentes. 


Hemos alcanzado un primer paso en el proceso de medición del funcionamiento 
del detector, que estamos empezando a probar. La tarea implica presentar al 
sujeto una serie de estímulos, y simplemente pedirles un juicio acerca de la 
valencia. Nuestra hipótesis es que las variables que cambien el punto neutro del 
detector hedónico se reflejarán en la proporción de juicios positivos y negativos. 
Si el método es exitoso, entonces esperamos tratar el detector hedónico de la 
misma forma que haríamos con un método sensorial. 


Por ejemplo, nos podríamos preguntar si el funcionamiento del detector estaría 
influido por el estado de ánimo cuando juzgamos estímulos tanto internos como 
externos, o ambos. Si es así, ¿el efecto del estado de ánimo se aplica a toda una 
serie de valencias?, por ejemplo, ¿un estado de ánimo bajo provoca un cambio 
en toda la escala haciendo que los estímulos negativos se vuelvan muy negativos 
y que los positivos sean menos positivos?, y ¿es este proceso progresivo, como 
parece ser en el caso de la influencia del estado de ánimo negativo sobre la 
memoria autobiográfica? ¿Nuestro modelo requiere una forma independiente del 
sistema de MCP para almacenar la emoción, o la valencia emocional llega 
directamente a través de las uniones con la MLP, como sospecho? Una cuestión 
relacionada es si la persistencia del estado de ánimo en el tiempo requiere un 
almacenamiento activo, y si es así si depende de la memoria de trabajo. De 
nuevo sospecho que tanto la activación en la MLP como el mantenimiento 


continuo de la emoción a un nivel neurobiológico implícito serían candidatos 
fuertes para este papel. Incluso sin estos aspectos de la emoción, hay sin 
embargo toda una serie de líneas de investigación potencialmente fructíferas que 
se han de seguir si queremos desarrollar una teoría adecuada sobre la forma en 
que la memoria de trabajo está influida por la emoción. 


15.5.2. Una perspectiva evolucionista 


Un atractivo rasgo de la interpretación generalmente aceptada de la influencia de 
la ansiedad y el miedo sobre la cognición es su plausibilidad dentro de un 
contexto evolucionista. Parece lógico asumir que un sistema que detecta 
amenazas potenciales debería tener un acceso inmediato preatencional y 
atencional a la memoria de trabajo. Aunque esto tenga un valor de supervivencia 
obvio, cuando funciona de forma inapropiada, es probable que interfiera con el 
funcionamiento normal. ¿Pero cuál es la ventaja que aporta la depresión para la 
supervivencia de las especies? 


Se han propuesto una serie de hipótesis evolucionistas. Entre ellas se incluye una 
visón de la depresión como petición de ayuda (Lewis, 1934), como un medio 
mediante el cual el organismo puede conservar el esfuerzo o los recursos 
(Thierry et al., 1984), como respuesta a la pérdida o al desconsuelo (Freud, 

1986; Oatley y Jonson-Laird, 1987), o rendirse a los conflictos sociales (Price et 
al. , 1994). Una revisión de esta literatura la proporciona Messe (2000), quien 
añade otra interpretación de la depresión, proponiendo que es un mecanismo que 
facilita el abandono de los objetivos inalcanzables. 


Sin embargo, mientras que todos describen situaciones que se podrían asociar 
con la depresión, no hay muchas evidencias de la prevalencia de una sola 
interpretación. Es más, típicamente se centran en influencias ambientales y no 
tienden a unirse estrechamente con mecanismos biológicos, ni explican la 
depresión endógena y su tendencia, como sucede en algunos casos, a fluctuar a 
lo largo del tiempo, sobre una base diaria o estacional. 


Sugiero que la hipótesis del detector hedónico es al menos tan plausible como 
sus competidoras dentro de un contexto evolucionista. Un mecanismo que sea 
central para el control motivacional de la elección y de la acción tiene un valor 


evolucionista obvio, compensando el coste sustancial que supone su mal 
funcionamiento en la depresión. 


15.6. Emoción: un enfoque más amplio 


Este capítulo ha sido uno de los más difíciles de escribir. Comenzó como un 
intento de ampliar lo que parecía una unión relativamente clara entre la memoria 
de trabajo y la emoción, tal como se refleja en el impacto de la ansiedad sobre la 
cognición. Cuando se aplicaba a la depresión, este sencillo modelo no parecía 
funcionar, y en mi intento por hacerlo funcionar me encontré con la hipótesis del 
detector hedónico. Seguí discutiendo esto con colegas mucho más expertos en el 
tema que yo, y les encontré esperanzados, sugiriendo que la idea era bastante 
plausible, relativamente novedosa y bien desarrollada. También me fueron de 
gran ayuda al sugerirme qué cosas debía leer. Pronto me di cuenta de que la 
cantidad de literatura relevante era enorme, diversa y se desarrollaba 
rápidamente. La intención de basar este capítulo en una revisión rigurosa y 
académica comenzó a desvanecerse rápidamente, y, tras terminar el resto del 
libro, decidí mantenerme pegado a mi versión inicial, pero añadiendo un breve 
epílogo en referencia a dos áreas que deberían recibir un tratamiento más 
sustancial. 


15.6.1. Teorías psicológicas de la emoción 


Primero, lamentando la falta de interacción entre los estudios sobre emoción y 
los estudios de la cognición, he sido algo etnocéntrico, concentrándome en el 
enfoque del procesamiento de la información de la psicología cognitiva dentro 
del cual se desarrolló el modelo multicomponente. Sigue habiendo una saludable 
preocupación por la emoción dentro de otras tradiciones, tanto en la europea 
(e.g., Scherer, 1984; Frijda, 2004) como en la norteamericana (e.g., Leventhal, 
1980; Lazarus, 1982; Zajonc, 1984). A diferencia de mis propios esfuerzos, 
muchos de estos enfoques han intentado captar el hecho de que las emociones no 
son simplemente positivas o negativas, sino que están compuestas por una serie 


de complejas y sutiles diferencias, emociones que, como propone Hume, pueden 
ser tan importantes dirigiendo la conducta como otras emociones más 
dramáticas, tales como el miedo o la rabia. Me gustaría describir brevemente un 
solo marco de trabajo que capte esta diversidad a la vez que me mantengo 
consistente con mis objetivos más bien simplistas. 


Leventhal y Scherer (9187) proponen un modelo en el que las emociones varían 
desde comportamientos reflexivos relativamente simples, hasta elaborados 
patrones cognitivo-emocionales que pueden incluir interacciones relativamente 
complejas dentro y entre niveles de procesamiento implícitos y explícitos. 
Intentan combinar teorías de la emoción y la cognición, observando que, «a 
pesar del grado de independencia entre la emoción y los mecanismos cognitivos, 
las teorías de la emoción seguirán siendo las primitivas a menos que traten la 
naturaleza del proceso y el tipo de contenidos cognitivos que dan lugar a 
emociones particulares» (Leventhal y Scherer, 1987, p. 13). Sus modelos asumen 
cinco fases de evaluación entre las que se incluye: (1) una nueva comprobación, 
(2) una comprobación del agrado intrínseco, (3) una comprobación de la 
importancia del objetivo/necesidad, (4) una posible comprobación del 
afrontamiento y, finalmente, (5) una comprobación de la compatibilidad 
norma/yo. El simple proceso de evaluación hedónica sugerido anteriormente se 
ajustaría razonablemente bien al segundo de los procesos, el cual determina si el 
suceso estimular es agradable y deberíamos aproximarnos, o si es desagradable y 
deberíamos evitarlo, un proceso basado tanto en rasgos de detección innata como 
en asociaciones aprendidas. 


Estas cinco etapas de decisión se aplican después a cada uno de los tres niveles 
de procesamiento, el sensoriomotor, el de los esquemas y el conceptual. En vez 
de describir las 15 fases de este marco de trabajo, ilustraré su aplicación cuando 
se aplica al segundo estado, la comprobación de una agradabilidad intrínseca que 
se aproxima más estrechamente a mi concepto del detector hedónico. Al nivel 
sensoriomotor, las preferencias innatas y las diversiones funcionarán por ejemplo 
evitando el dolor o los ruidos inesperados elevados, o con la atracción por la 
comida en un organismo hambriento. Un nivel de evaluación de esquemas más 
alto estará basado en preferencias aprendidas y en aversiones, la atracción de un 
lugar asociado con comida o seguridad, o la evitación de uno asociado con un 
enemigo, por ejemplo. A nivel conceptual, la evaluación se basará en el recuerdo 
de información anticipada positiva o negativa o bien información obtenida 
indirectamente, por ejemplo, elegir viajar a un lugar con abundante comida 
madura en esa época, a través de una ruta libre de enemigos. En este punto, diré 


sencillamente que mis propias especulaciones simplistas son ampliamente 
consistentes con este marco de trabajo mucho más rico, y creo que si tuviera que 
desarrollar mi propio punto de vista, es probable que sacara provecho del 
contacto cercano con esta literatura. 


15.6.2. Enfoques neurobiológicos a la emoción 


Como apunté anteriormente, muchos trabajos anteriores sobre la emoción han 
confiado en los estudios con animales, una situación que está cambiando 
actualmente con el rápido incremento de investigaciones sobre la emoción en 
humanos. Una de las razones más obvias de esto es el desarrollo de la 
neuroimagen, que permite análisis mucho más sofisticados acerca de los efectos 
de la emoción de los que parecían posibles usando puramente los métodos 
conductuales. Una segunda razón, según mi propio juicio, proviene del interés en 
la emoción que ha promovido el trabajo de Damasio, que acentúa la importancia 
de la emoción en la cognición diaria, proponiendo su unión con estímulos 
somáticos, y que funciona a través de regiones cerebrales claramente 
especificadas. Finalmente, el desarrollo de la Tarea de Apuestas de lowa (IG'T) 
ha proporcionado un método experimental para poner a prueba las predicciones 
de la hipótesis de los marcadores somáticos. Sin embargo, la hipótesis de 
Damasio no ha escapado a la crítica, y, ya que constituye la base de la hipótesis 
del procesador hedónico descrita anteriormente, estas críticas serán discutidas 
brevemente, junto con las implicaciones sobre mi propio punto de vista. 


15.6.2.1. ¿Los marcadores somáticos son verdaderamente somáticos? 


Esta no es una pregunta fácil de responder. Óhman y Soares (1994) y Parra et al. 
(1998) no encontraron correlación entre la magnitud de un arousal automático y 
la capacidad de los sujetos para predecir un shock en un paradigma de 
condicionamiento enmascarado. Sin embargo, en un estudio posterior de Katkin 
et al. (2001) se encontró que un subgrupo capaz de juzgar sus propios latidos del 
corazón sí mostraba una correlación positiva con los éxitos, usando los indicios 


enmascarados para «adivinar» si aparecería shock o no, en línea con la propuesta 
de que las decisiones «instintivas» puede que estén visceralmente basadas. 


Otros han estudiado a pacientes cuya retroalimentación se ha visto 
comprometida, y han medido su capacidad para los juicios emocionales, 
incluyendo el rendimiento en la tarea de IGT. Por el momento los resultados no 
han apoyado mucho la hipótesis (North y O*Carroll, 2001; Heims et al. , 2004). 
Sin embargo, la retroalimentación autonómica está basada en una serie de rutas 
fisiológicas diferentes, y es difícil estar seguro de que todas han sido eliminadas 
de los estudios (Craig, 2002). Es más, estos pacientes han crecido típicamente 
con una retroalimentación autonómica normal, pudiendo aprender las valencias 
hedónicas, y presumiblemente usándolas como sustituto de indicios viscerales 
más directos. 


Otras fuentes de evidencia incluyen la presencia de respuestas autonómicas, 
como la respuesta electrodérmica que sugiere un componente autonómico en la 
tarea IGT con sujetos normales, y su anormalidad en pacientes que fracasan en la 
tarea IGT (Bechara et al. , 1997; Blair y Cipolotti, 2000). Se están acumulando 
pruebas mucho más fuertes a partir de estudios con neuroimagen asociados con 
las propuestas de Damasio respecto a que el área orbitofrontal de los lóbulos 
frontales es crucial tanto para la emoción como para la toma de decisiones. 


15.6.3. ¿Es crucial la corteza orbitofrontal? 


La propuesta de Damasio de que la corteza orbitofrontal es central para el 
funcionamiento del sistema de marcadores somáticos surgió a raíz de la 
observación del área del cerebro dañada en sus pacientes clásicos. Estos 
pacientes eran por supuesto mucho más pequeños en número, lo que sugería una 
clara necesidad de réplica. Aunque existe una serie de demostraciones sobre el 
deterioro en la toma de decisiones asociado a un daño en la corteza orbitofrontal 
(OBF), muchos de estos pacientes también tienen dañadas otras áreas, incluidas 
la corteza dorsolateral anterior y el giro cingulado (Bechara et al. , 1994; 1997; 
1998). Manes et al. (2002) intentaron evitar este problema comparando pacientes 
con lesiones OBF discretas, pacientes dorsolaterales y dorsomediales y pacientes 
con graves lesiones frontales. Los pacientes OBF alcanzaron los niveles control 


en las tres tareas de toma de decisiones, aunque fueron más lentos, mientras que 
los pacientes dorsolaterales y dorsomediales tuvieron un deterioro en la tarea 
IGT, ya que era el grupo con grandes lesiones frontales. Manes et al. 
concluyeron que tanto la zona ventral como la dorsal de la corteza prefrontal 
estaban probablemente involucradas en el rendimiento en la tarea IGT. 


Otra evidencia de la importancia del córtex prefrontal proviene de los estudios 
de neuroimagen. Por ejemplo, Coricelli et al. (2005) usaron la £MRI para 
estudiar el sentimiento de «arrepentimiento» que aparecía en los sujetos al 
descubrir que habían elegido la apuesta errónea, encontrando una mayor 
actividad en la región orbitofrontal media y en la amígdala. La activación en esta 
área también es sensible a la toma de decisiones basada en términos afectivos en 
pacientes con manía (Elliott et al. , 2004), y ha demostrado ser una de las áreas 
frontales implicadas en los sesgos de procesamiento congruentes con el estado 
de ánimo en pacientes depresivos (Elliott et al. , 2002). En general, por tanto, 
parece que se está acumulando evidencia en torno a un posible papel del córtex 
orbitofrontal en la toma de decisiones basada hedónicamente, probablemente en 
combinación con otra serie de regiones, siendo una de ellas la amígdala. Se sabe 
desde hace tiempo que esta estructura ha estado asociada con la adquisición de 
respuestas ante el miedo (LeDoux, 1996) y más recientemente también ha 
demostrado estar asociada con la respuesta de los pacientes depresivos a las 
caras emocionales (Sheline et al. , 2001). 


Sin embargo, también hay evidencias procedentes de estudios con animales 
sobre la importancia de la amígdala en una amplia serie de emociones, 
incluyendo las recompensas positivas. Wutz y Olds (1963) mostraron que los 
animales aprenderían a presionar una palanca tras un refuerzo que consistiera en 
la estimulación eléctrica de la amígdala. Estudios posteriores de lesiones 
también han implicado a la amígdala en el refuerzo tanto positivo como negativo 
(Everitt et al. , 2003; Nelly, 2004). Esto se confirma en un reciente estudio de 
Knapska et al. (2006) usando una técnica de inmunomarcaje mediante la cual se 
han encontrado distintas regiones en la amígdala que responden selectivamente 
al aprendizaje apetitivo y aversivo. Aunque mucha de la evidencia está basada 
por el momento en estudios con animales, es posible asumir un papel para la 
amígdala tanto en el aprendizaje hedónico positivo y negativo como en la 
evaluación hedónica en humanos. En conclusión, aunque seguimos estando lejos 
de una comprensión detallada del papel de regiones anatómicas específicas en la 
emoción y la decisión, las propuestas de Damasio parecen estar recibiendo un 
amplio apoyo. 


15.6.4. La Tarea de Apuestas de lowa (IGT) 


Aunque la IGT ha jugado un papel importante ampliando el alcance de la 
hipótesis de los marcadores somáticos (Bechara et al. 1994; 1997; 1998), la tarea 
es algo compleja, sugiriendo que bajo ciertas circunstancias podría depender de 
la memoria de trabajo, en vez de proporcionar una simple medida de la 
adquisición de marcadores somáticos. Bechara et al. (1998) rechazan esta 
interpretación sobre la base de que los pacientes que muestran un deterioro en la 
IGT no fracasaban en una tarea de memoria de trabajo ejecutiva. Sin embargo, 
por desgracia, la única tarea de memoria de trabajo que ellos usaron fue un 
procedimiento de equiparación demorado. Aunque en la literatura animal se 
considera que esto es una prueba de memoria de trabajo, hasta donde yo sé no ha 
demostrado ser una medida neuropsicológica apropiada para detectar el daño en 
el lóbulo frontal en humanos, como indican los capítulos 7 y 8, es poco prudente 
considerar una sola tarea como medida adecuada de la capacidad ejecutiva. Es 
más, los tamaños de los grupos de su estudio eran pequeños, y los pacientes con 
lesiones frontales eran muy variables en la exhibición de sus deficiencias 
(Rabbitt, 1997). 


Hinson et al. (2002; 2003) presentaron pruebas a favor de la implicación de la 
memoria de trabajo en la IGT, aunque Maia y McClelland (2004) también 
critican los supuestos sobre los que se basa la IGT. Por tanto, aunque la IGT ha 
resultado ser valiosa estimulando la investigación en esta área, también está 
abierta a la crítica. Por tanto, sería poco razonable suponer que una tarea 
experimental pudiera proporcionar una prueba adecuada de una teoría que es tan 
potencialmente importante como la hipótesis de los marcadores somáticos. No 
hay duda de que a su debido tiempo se desarrollarán otros métodos 
preferiblemente más sencillos. 


¿Cómo de seria es la controversia que rodea a la IGT en relación con mi propia 
versión de la hipótesis de los marcadores somáticos? Desde mi punto de vista, no 
es nada seria en absoluto: la hipótesis de la valencia hedónica que conforma la 
base de mi propuesta no depende de la validez de ninguna medida experimental. 
Sin embargo, refuerza mi idea de que necesitamos desarrollar otras medidas 
preferiblemente más simples. Entre ellas se deberían incluir medidas directas de 


juicios hedónicos, y del almacenamiento y la manipulación de rasgos hedónicos 
en la memoria de trabajo. Estas medidas se podrán combinar a su debido tiempo 
con medidas que, como la IGT, están diseñadas para estudiar la capacidad para el 
aprendizaje hedónico nuevo. 


15.7. Conclusiones 


El miedo, el anhelo y la depresión dificultan la memoria de trabajo apoyando la 
idea de Damasio y LeDoux de que la transformación de estímulos emocionales 
fisiológicos en sentimientos psicológicos está mediada por la memoria de 
trabajo. En el caso del miedo y el anhelo, la interrupción aparece porque los 
indicios emocionales implícitos conllevan una elaboración explícita, un proceso 
que implica tanto al almacenamiento como a los componentes ejecutivos de la 
memoria de trabajo. En el caso de la depresión, se supone que los efectos 
funcionan principalmente a través de un detector hedónico y un mecanismo 
comparativo que subyace al control de la acción mediante la motivación. Una 
colocación inadecuada del punto neutro del comparador da lugar a un bucle de 
retroalimentación que se autoperpetúa, por el cual tanto la evaluación situacional 
como la memoria autobiográfica se vuelven progresivamente más negativas. 
Este proceso se ve exacerbado por la tendencia a la rumiación que lleva a la 
inactividad a medida que se debilitan los «faros de incentivos». 


La hipótesis del detector hedónico tiene la ventaja de que une los enfoques 
biológico y psicológico de la depresión dentro de un contexto evolucionista 
amplio y plausible. Queda por ver si se podría desarrollar un modelo más 
detallado, y si es así, si finalmente podría contribuir a un mayor desarrollo de los 
métodos de tratamiento. 


CAPÍTULO 16 


Conciencia 


Quizá el mayor cambio en los últimos 20 años dentro de la psicología cognitiva 
y de la ciencia cognitiva en general haya sido la aceptación de la conciencia 
como un problema legítimo y tratable. Durante una gran parte del siglo 
diecinueve, el campo ha estado enredado en disertaciones filosóficas sobre el 
problema cuerpo-mente, y reprimido por las limitaciones empíricas de la 
introspección. Más recientemente, cada vez está más claro que nada de esto 
representa la clase de obstáculos fundamentales que originalmente se temían. Es 
más, la necesidad de explicar fenómenos como la ceguera cortical y la memoria 
implícita, en los que la percepción y el recuerdo discrepan con la experiencia 
consciente del que percibe o del que recuerda, supone un fuerte argumento para 
rescatar de la psicología empírica el estudio de la conciencia. 


Por supuesto, hubo quien adoptó un enfoque casi místico del tema (Eccles, 1976; 
Penrose, 1994), mientras que otros propusieron que sería necesario un tipo de 
ciencia totalmente nueva si queríamos comprender por qué tenemos las 
experiencias conscientes o el qualia que tenemos. Un buen ejemplo de este 
último enfoque es el argumento del hipotético caso de un científico daltónico. Se 
supone que este investigador podría aprender todo lo que hay que saber acerca 
del daltonismo, pero seguiría sin comprender el sistema subyacente de la misma 
manera que sus colegas con visión normal. Sin embargo, no tengo muy claro que 
esta situación sea algo distinta del caso de alguien que estudie el vuelo de las 
mariposas. Sin embargo, adecuando su comprensión, sería improbable que esa 
persona fuera capaz de revolotear de flor en flor. Su conocimiento sería 
explícito, y totalmente diferente del conocimiento presumiblemente implícito 
que se necesita para que la mariposa pueda volar. Mi propia visión es que la 
tarea de la ciencia es comprender el mundo explícitamente, y que una 
comprensión explícita de la conciencia es simplemente parte de esta tarea. 


16.1. Un enfoque pragmático de la conciencia 


Admito que la conciencia es una solución natural especial a un problema, o 
quizás a una serie de problemas biológicos que han surgido en el proceso 
evolutivo. Sugiero que este enfoque pragmático y empírico de la comprensión de 
la conciencia es tanto viable como fructífero, dados los métodos técnicos y 
experimentales ahora disponibles para la psicología cognitiva y la neurociencia. 


Una discusión detallada de la conciencia está más allá de los objetivos de esta 
revisión de la memoria de trabajo. Marcel y Bisiach (1988), Dennett (2001) y 
Gray (2004) proporcionan una discusión de los aspectos más filosóficos, 
mientras que Baars (1997) aporta una visión más general del campo. Sin 
embargo, cada vez se ha ido viendo más claro que la conciencia parece estar 
muy relacionada con el control ejecutivo y, por tanto, con el funcionamiento de 
la memoria de trabajo. El modelo multicomponente de memoria de trabajo afinó 
el término de conciencia, postulando un ejecutivo central parecido a un 
homúnculo. Más recientemente, sin embargo, la conciencia se ha caracterizado 
directamente dentro del marco de trabajo de la memoria de trabajo, inicialmente 
como un fenómeno de estudio (Baddeley, 1993; Baddeley y Andrade, 1998), y 
posteriormente a través de su papel central en el concepto de búfer episódico. La 
línea que sigue refleja mi actual visión acerca del tema de la conciencia, la cual, 
como se observará, posee semejanzas con lo que Baars (2002a) describe como la 
hipótesis del espacio de trabajo global. Esto sugiere que la memoria de trabajo 
ha evolucionado para servir a una serie de funciones, incluyendo 
primordialmente la que proporciona un espacio de trabajo donde la información 
procedente de fuentes muy distintas se puede combinar y usar, tanto para 
comprender la situación actual como para planificar la acción futura. 


Baars cita al menos una docena de fuentes que han abogado de manera 
independiente por este enfoque, incluyendo a Dennett (2001), que propone que 
la conciencia representa «una sociedad de especialistas distribuidos que está 
equipada con una memoria de trabajo llamada espacio de trabajo global, cuyos 
contenidos se pueden distribuir al sistema como un todo» (Dennett, 2001, p. 42). 
Sin embargo, en el tema de la conciencia es útil distinguir entre dos aspectos del 
concepto: uno relacionado con los aspectos energéticos y de arousal y el otro 
relacionado con su dirección y control. Estos dos se discutirán por separado. 


16.2. La conciencia central 


El término conciencia central fue propuesto por Damasio (2000), y se puede 
considerar mejor como un contraste entre el estado de conciencia y el estado de 
inconsciencia. La conciencia en este sentido está ausente en el sueño profundo, 
en el coma profundo, y bajo una fuerte anestesia. El hecho de que la profundidad 
se tenga que especificar claramente, implica que la conciencia central no es un 
estado que se defina en términos de todo o nada. La diferencia básica entre el 
sueño, el coma y estado de vigilia parece reflejar el funcionamiento de la parte 
superior del tallo cerebral, el hipotálamo y el tálamo. En el sueño profundo 
parece faltar la conciencia. En otros niveles de sueño, como en la fase de los 
movimientos oculares rápidos (REM), la presencia de sueños que algunas veces 
se recuerdan implica claramente algún tipo de conciencia, un estado que también 
se refleja en las actividades eléctricas del cerebro. 


El coma profundo es una variable médicamente importante que, en el caso de 
daños cerebrales, por ejemplo, correlaciona con la probabilidad de recuperación 
(Brooks et al. , 1987; Teasdale y Jennett, 1974). Un control cuidadoso de la 
profundidad de la conciencia puede ser también un indicador importante de la 
recuperación del paciente o de su recaída. Ambos procesos, sin embargo, tienden 
a ser muy graduales y no son fácilmente observables. Para facilitar esto, Wilson 
et al. (2001) han desarrollado una escala, la escala Wessex para Traumatismos 
Cerebrales (WHIM)*, basada en el hecho de que, a pesar de la variabilidad, las 
funciones tienden a recuperarse ampliamente en el mismo orden. 


Un paciente puede recuperarse de un coma pero seguir siendo poco consciente 
de sí mismo o del entorno. El estado conocido como estado vegetativo 
persistente que normalmente refleja un daño en el tallo cerebral superior y en el 
hipotálamo, puede incluir un ciclo normal de sueño/vigilia, pero sin que el 
paciente muestre evidencias de ser consciente de lo que le rodea. Es importante 
diferenciar esto del síndrome de cautiverio, en el que el desgraciado paciente 
puede ser totalmente consciente de lo que ocurre, pero es incapaz de responder 
debido a una parálisis, y apenas puede mover sus ojos. Esta respuesta tan 
mínima se puede usar para desarrollar una forma de comunicación laboriosa 
pero efectiva. 


En el síndrome vegetativo persistente, los pacientes no son conscientes ni 
pueden controlar las acciones. Esto contrasta con la forma de inconsciencia 
conocida como automatismo epiléptico, en la que el paciente sufre períodos de 
ausencia mental. Durante las ausencias, los ojos del paciente se ponen en blanco 
y él o ella permanecen inmóviles. A este estado le puede seguir una conducta 
muy compleja y organizada que parece darse en ausencia de un estado 
consciente. Por tanto, un paciente puede levantarse, cruzar la habitación, abrir 
una puerta y salir, recuperando la conciencia posteriormente y sin recordar los 
últimos minutos de su vida. Esto se asocia típicamente con la actividad 
epiléptica que influye en la corteza cingulada y/o en el tálamo. 


Igual que se puede tener acción sin conciencia, se puede tener conciencia sin 
acción, un estado que tiende a reflejar un daño en la corteza cingulada. Un 
ejemplo es el «mutismo akinético», en el que un paciente puede ser 
completamente consciente, pero incapaz de iniciar una acción. Baddeley y 
Wilson (1986) intentaron estudiar la memoria autobiográfica de un paciente de 
este tipo. Nuestro procedimiento consistía en presentar una serie de indicios 
verbales y preguntarle por los recuerdos personales que le sugirieran los indicios. 
De los 12 indicios que le dimos, solo uno le evocó una respuesta. Ante el indicio 
perro, contestó «Sealyham», una raza de perro. Una semana más tarde 
obtuvimos exactamente el mismo tipo de respuestas a nuestros indicios. Al 
preguntarle a su mujer, ella nos confirmó que anteriormente había sido mordido 
por un perro de raza Sealyham, este fue el único incidente que al parecer fue lo 
suficientemente vívido como para incitarle una respuesta verbal. 


16.3. Conciencia bajo anestesia 


Una forma de manipular la conciencia en sujetos normales es a través de la 
anestesia. Esta se ha convertido en un área de considerable importancia práctica 
tras una serie de informes de pacientes que habían sufrido operaciones 
quirúrgicas y habían permanecido conscientes aunque no lo pareciera. Esto 
ocurre, aunque sea muy poco deseable, debido a que los pacientes toman un 
«cóctel» de fármacos, no solo con el fin de eliminar la conciencia y reducir el 
dolor, sino también como relajante muscular, lo que puede tener el efecto de 
dejar al paciente consciente, pero incapaz de moverse, y por tanto incapaz de 


comunicar este hecho. Muchos anestésicos también contienen un tercer 
componente tranquilizante que típicamente conlleva un efecto amnésico de 
cualquier cosa que se haya experimentado bajo la anestesia. Por ello, el número 
de relatos de personas conscientes bajo anestesia es relativamente pequeño (John 
et al. , 2001) y se puede desestimar. 


Otra serie de estudios han intentado detectar la memoria de sucesos ocurridos 
durante una operación quirúrgica, usando paradigmas de memorias explícitas o 
bien implícitas (ver Andrade, 1995; 2005). En un estudio reciente se usó la 
anestesia en odontología. Durante la intervención, el experimentador hacía 
intención de pronunciar la frase: «Espera —no me gusta el color de sus labios. — 
Sus labios están demasiado azules.» Ninguno de los diez pacientes expuestos a 
este mensaje de alarma consiguió recordarlo después espontáneamente, pero 
cuatro de ellos reprodujeron el recuerdo letra a letra bajo hipnosis y otros cuatro 
mostraron un recuerdo fragmentado. En estudios posteriores que usaban material 
menos dramático se han obtenido resultados algo más mixtos; Andrade (1995) 
cita ocho estudios en los que se presentaron pares de palabras y después se ponía 
a prueba el recuerdo; de los ocho estudios, solo dos mostraron resultados 
positivos. Otros estudios han usado métodos implícitos para poner a prueba el 
recuerdo, ya que es menos probable que estos métodos sufran los efectos 
amnésicos de la anestesia. En un caso, por ejemplo, se les dijo a los sujetos bajo 
anestesia que cuando se recuperaran deberían poder recordar tirándose del lóbulo 
de su oreja. De los nueve estudios, tres obtuvieron resultados positivos. 
Evidencias algo más débiles provienen de estudios en los que el paciente recibe 
palabras de ánimo mientras que le operan, tales como «te sentirás mejor», O 
«querrás levantarte pronto después de la operación». En este caso, 12 de 17 
estudios encontraron evidencias de una recuperación ligeramente mejor en los 
pacientes con sugestiones positivas. 


Un problema presente en todos estos estudios es el grado de anestesia. 
Claramente, el anestesista no quiere darle al paciente una dosis mayor de la 
necesaria, y es completamente posible asumir que el nivel de sedación fluctuará 
durante la operación, posiblemente siendo algo menor en algún punto de la 
misma. Por tanto, en estudios posteriores se ha intentado monitorizar el nivel de 
anestesia de forma continua. Andrade et al. (1994) variaron sistemáticamente la 
dosis de isofluorano en un estudio con sujetos voluntarios normales, que no 
estaban bajo tratamiento, y que por tanto no recibían relajantes musculares 
adicionales ni sedantes. Su tarea consistía en escuchar una secuencia de palabras 
habladas, y responder manualmente cuando una palabra se repitiera. Por 


supuesto, esta respuesta no es posible bajo condiciones normales de cirugía con 
anestesia, que incluye relajantes musculares. Cuando una palabra se repetía 
inmediatamente, los sujetos con el nivel más bajo de isofluorano la detectaban 
todas las veces, en contraste con una tasa de detección del 40 por ciento en los 
sujetos con dosis doble. Cuando la palabra repetida aparecía dieciséis palabras 
después, los sujetos en la condición libre de anestesia la detectaban un 60 por 
ciento de las veces, frente a un 30 por ciento en los sujetos con dosis bajas, 
mientras que los sujetos con dosis altas nunca detectaban la repetición demorada. 


La profundidad de la anestesia se puede reducir hasta cierto punto mediante 
estímulos que esperaríamos que incrementaran el nivel de arousal, como gritar o 
emplear el nombre del sujeto. En un intento de simular el posible efecto que 
causaría un corte quirúrgico, Andrade et al. suministraban un ligero shock 
eléctrico cuando el sujeto dejaba de responder. Esto solía producir una 
recuperación de la respuesta definitiva aunque ligera. 


El principal objetivo de este estudio consistía en intentar validar medidas 
electrofisiológicas del nivel de conciencia. En general, los resultados fueron 
alentadores, sugiriendo que la conciencia se podía monitorizar mediante medidas 
conductuales, y que estas medidas están muy asociadas con la actividad 
electrofisiológica del cerebro. En los últimos años ha existido un acuerdo general 
acerca de la necesidad de controlar la profundidad de la anestesia, antes de 
concluir que una aparente memoria posterior no se podía atribuir al 
procesamiento del material durante una fluctuación periódica de la profundidad 
de la conciencia. Cuando se toman estas precauciones, parecen darse buenas 
pruebas de la presencia de un priming perceptivo durante la anestesia, medido, 
por ejemplo, a través de una tarea de completar palabras. Se presenta una lista de 
palabras al sujeto anestesiado, y después se le pide que «adivine» una palabra 
presentándole las primeras letras. La presentación previa sesga la respuesta 
«adivinada», incluso en pacientes amnésicos. Por ejemplo, si a un paciente se le 
presenta la palabra «sabor», el paciente anteriormente anestesiado es más 
probable que complete las letras SA-con la palabra «sabor» que con «salón», que 
es una respuesta más probable en ausencia del priming. Sin embargo, no parece 
haber evidencia de la capacidad para asociar dos palabras previamente 
presentadas pero no relacionadas entre sí (Andrade, 2005; Deeprose y Andrade, 
2006). 


Claramente, nuestro estado de conciencia también tiende a fluctuar incluso bajo 
condiciones normales en la vida diaria. Cuando nos despertamos tendemos a 


estar adormilados, nuestro nivel de alerta se incrementa durante la mañana, 
descendiendo en algún punto cuando nos cansamos (Folkard, 1996). De forma 
similar, circunstancias externas pueden influir en nuestro nivel de arousal, desde 
un nivel bajo, como cuando estamos medio escuchando una aburrida 
conferencia, hasta niveles extremadamente altos, como, por ejemplo, cuando 
estamos acorralados por un perro feroz. El nivel de aorusal también difiere 
dramáticamente en ciertos pacientes psiquiátricos. Dentro de la población 
normal, está claro que ciertas personas parecen tener una gran energía mental y 
física, mientras que otras son habitualmente letárgicas. Sin embargo, hasta donde 
yo sé, este fenómeno obviamente importante parece que ha sido relativamente 
poco estudiado por los psicólogos cognitivos desde el año 1960, cuando el 
arousal todavía era un tema popular dentro de la psicología cognitiva 
(Broadbent, 1971; Kahneman, 1973). Ya va siendo hora de que el tema se 
retome. 


16.4. El control consciente y la hipótesis del espacio de trabajo global 


Implícitamente, todos los estudios de memoria de trabajo han empleado sujetos 
que estaban completamente conscientes, y se han preocupado por el control y la 
utilización de la conciencia, en vez de por el nivel de conciencia general. De 
hecho, esto es lo que ha ocurrido con lo que creo que sería el enfoque 
dominante, la hipótesis del espacio de trabajo global mencionada anteriormente, 
que será descrita atendiendo concretamente a la reciente revisión que hace Baars 
(2002a) de este enfoque, distinguiendo entre distintas subhipótesis, las cuales 
iremos considerando por turnos. 


1. El procesamiento explícito demanda un espacio de trabajo global. Baars cita 
un estudio de Dehaene et al. (2001) que usa la FMRI para estudiar el 
procesamiento de palabras presentadas visualmente bajo condiciones normales y 
condiciones de enmascaramiento hacia atrás, bajo las cuales el sujeto no puede 
informar de la palabra estímulo. La percepción normal origina una activación 
generalizada de las áreas visual, parietal y frontal, que no se activan cuando el 
enmascaramiento impide tomar conciencia de la palabra. Estos resultados son 


consistentes con el segundo punto de Baars, concretamente: 


2. La percepción consciente permite un amplio acceso a la información a través 
del cerebro. Los procesos ejecutivos tienden a hacer que la información 
procesada conscientemente esté disponible a partir de una serie de codificaciones 
diferentes, mientras que la codificación implícita, como la que se da en el 
priming perceptivo enmascarado tiende a ser específica de la modalidad en 
cuestión. 


3. La memoria de trabajo depende de la conciencia. Este también es un supuesto 
importante en mi propio enfoque de la memoria de trabajo. Además de referirse 
al papel de la conciencia en el búfer episódico, Baars se refiere al reciente 
trabajo de John et al. (2001) que estudió el EEG durante seis tareas de memoria 
de trabajo. La interpretación, por supuesto, depende de que se asuma que las 
respuestas electrofisiológicas son efectivamente marcadores del estado 
consciente. 


4. La conciencia permite la combinación de material nuevo. Esta es por supuesto 
una de las principales funciones que se le atribuyen al búfer episódico. Es 
curioso que, aunque las palabras individuales se puedan ver facilitadas 
subliminalmente, las combinaciones de palabras múltiples no parecen ser 
susceptibles al priming, cuando se enmascaran o cuando se presentan a través de 
un canal no atendido en un estudio de escucha dicótica (Greenwald y Liu, 1985), 
o como se mencionó anteriormente, bajo anestesia (Deeprose y Andrade, 2006). 
La esencia de la comprensión del lenguaje consciente es, por supuesto, la 
obtención de significado a partir de la combinación de palabras dentro de la 
expresión; esto sugiere que la comprensión del lenguaje al menos demanda un 
grado mínimo de conciencia, aunque, como se sugiere en el Capítulo 9, solo 
requiera una mínima demanda sobre el ejecutivo central. 


5. La conciencia es esencial para el aprendizaje explícito y para la memoria 
episódica. Las buenas estrategias mnemónicas dependen de su capacidad para 
integrar material previamente no asociado mediante una manipulación 
consciente, por ejemplo, mediante interacciones de imágenes visuales. El hecho 
de combinar estímulos no relacionados previamente probablemente juegue un 
papel central en los intentos de analizar el búfer episódico en sus 
subcomponentes y subprocesos. 


La cuestión de si el aprendizaje se da alguna vez de forma inconsciente sigue sin 


resolverse. Las evidencias de un aprendizaje mientras dormimos o durante una 
profunda anestesia dependen típicamente de estudios en los que la profundidad 
de la conciencia no estaba controlada (Andrade, 1995). Sí hay, por supuesto, 
abundantes pruebas de un aprendizaje implícito en el que el aprendiz no es 
consciente de la naturaleza concreta de lo que está aprendiendo. Por ejemplo, la 
adquisición de la gramática de la lengua nativa implica un aparente dominio de 
las reglas gramaticales sin saber necesariamente qué reglas son esas (Reber, 
1993). Sin embargo, en todos estos casos, no es el material en sí mismo el que 
resulta inconsciente, sino las relaciones que operan dentro de él. Ambos parecen 
depender de la capacidad del material básico para alcanzar la conciencia (ver 
Shanks y St John, 1994, y Baddeley, 1998, Capítulo 19, para revisiones). 


6. La conciencia permite la monitorización y el ajuste del control motor. Una 
gran cantidad de nuestra conducta depende de bucles de retroalimentación que 
son demasiado rápidos para el acceso consciente directo, como en el caso de 
muchas habilidades motoras complejas. Sin embargo, cuando la conducta falla, 
el control consciente puede intervenir proporcionando una solución alternativa. 
Por ello, si le pedimos a un sujeto que apunte a un objetivo bajo el agua, al 
principio lo hará mal debido al efecto de refracción del agua, pero después, 
podrá mejorar al ser consciente de la refracción (Judo, 1908). Un buen 
entrenador deportivo será capaz de identificar los problemas en cuanto a las 
habilidades de la conducta motora, como el swing en un club de golf, y podrá 
utilizar entonces el control consciente para corregirlas, confiando posteriormente 
en la práctica, de forma que la acción modificada se vuelva cada vez más 
automática, permitiendo finalmente un funcionamiento con un mínimo de 
atención. Haier et al. (1992) demostraron este proceso experimentalmente en 
sujetos que habían practicado mucho con el Tetris, un juego de ordenador, 
mientras que al mismo tiempo se monitorizaba la actividad cerebral. 
Inicialmente, mientras estaban jugando al juego, se daba una alta activación en 
amplias áreas del cerebro: tras dos semanas practicando, el nivel de activación 
era mucho menor, un resultado que es consistente con la hipótesis de una 
demanda atencional reducida. 


16.4.1. El teatro de la conciencia 


Baars sugiere que «hoy en día todas las teorías unificadas de la cognición 
incluyen metáforas escénicas» (1997, p. 43). Una versión propuesta por el propio 
Baars sitúa en el centro a la memoria de trabajo, que compara con la fase en la 
que estarían actuando varios actores cognitivos, iluminados por el foco de la 
atención. La zona del escenario menos iluminada representa los aspectos de la 
memoria inmediata que no son actualmente el foco de atención. Los «actores» 
recopilan información de tres tipos de entradas, concretamente: (1) la apertura de 
los sentidos como escuchar, sentir, tocar y así sucesivamente; (2) información 
cuasisensorial que es autogenerada, como el habla interna y las imágenes 
visuales, y finalmente (3) ideas que son esencialmente no-sensoriales en 
naturaleza, aunque podrían tener asociaciones visuales o verbales. Las 
actuaciones de estos componentes informativos son controladas por detrás de la 
escena por una serie de procesos ejecutivos que incluyen al «director» (el yo) y 
un «controlador del foco»; ambos influidos por una serie de contextos locales. 
Finalmente, el acto de la memoria de trabajo y sus actores es visto por una 
audiencia inconsciente compuesta por un saco de sistemas de memoria, 
intérpretes, procesos automáticos y sistemas motivacionales, algo mezclados. 


Aunque esta analogía podría parecer algo forzada, Baars (1997) hace un buen 
uso de ella como base para una visión general, de utilidad para el lector no 
especializado, acerca de los conocimientos actuales en la investigación de la 
conciencia. Cualquier metáfora tendrá inevitablemente sus limitaciones, pero la 
metáfora del teatro de Baars tiene dos ventajas importantes. La primera es la 
capacidad para reflejar la pura complejidad de aquellos factores que interactúan 
con la conciencia, junto con la importancia central del control atencional. La 
segunda ventaja es que lo hace usando una metáfora que es fácilmente 
comprensible, tal como se refleja en la sucinta definición de Patrick Rabbitt 
sobre la extrema antigúedad, como los tiempos en los que «el teatro de la mente 
era la única actuación en la ciudad». 


¿Hasta qué punto la metáfora del teatro proporciona una base útil para 
desarrollar una teoría científica? La respuesta dependerá seguramente de los 
usuarios científicos. En mi caso, hay una serie de conceptos que me gustaría 
cambiar, O al menos elaborar. Tratar a los actores importantes simplemente como 
reflejo de las diferentes fuentes de información ignora el progreso que hemos 
conseguido al dividir esas fuentes en visoespaciales y auditivoverbales, por 
ejemplo. Por supuesto, la metáfora de un actor es suficientemente flexible como 
para permitir una amplia variedad de interpretaciones, pero entonces la falta de 
cualquier restricción real probablemente reduzca su valor explicativo. 


Finalmente, no estoy muy contento con el papel tan pasivo que se le ha asignado 
a la «audiencia inconsciente». 


Entonces, ¿cómo reorganizaría yo el teatro? ¿A quién mantendría y a quién 
echaría? En primer lugar, no me gustaría echar a ninguno de los participantes, ya 
que creo que Baars consigue buenos argumentos sobre la importancia de todos 
los componentes. Sin embargo, cambiaría la metáfora de esta analogía de 
escenificación activa y audiencia relativamente pasiva, por una analogía mucho 
más interactiva. Considero que la memoria de trabajo reside en el corazón de un 
sistema que está construido para hacer cosas. Es más, sugiero que todos los 
componentes que participan son interdependientes, y la importancia de cada uno 
depende de las circunstancias particulares. Yo escogería, por tanto, la metáfora 
del gobierno. 


Si usamos como ejemplo un estado moderno, entonces la memoria de trabajo 
sería equivalente a aquellos aspectos del gobierno que fueran obvios para todos; 
promulgar y respetar las leyes, decisiones sobre cómo interaccionar con otros 
gobiernos, cambios en las políticas financieras y así sucesivamente. Por 
supuesto, es probable que todos ellos dependan de una gran cantidad de 
actividad subyacente menos visible. Por tanto, aunque las leyes son promulgadas 
por el gobierno, su implementación dependerá del Servicio Civil, y del gobierno 
local, los cuales dependerán de los sistemas de comunicación y transportes, 
sistemas de apoyo médico y, por supuesto, de los votantes, o, en el caso de un 
sistema totalitario, del ejército. Al igual que el gobierno, la memoria de trabajo 
consciente parece ser en principio la única importante, pero, al igual que el 
gobierno, depende crucialmente de su interacción con una amplia serie de 
actividades implícitas que subyacen a su funcionamiento. Por tanto, ¿existe una 
clara correspondencia entre las funciones cognitivas y las funciones de un estado 
como el ejército, el transporte, la medicina y la industria? Yo lo dudo, aparte de 
observar que ambos, el control consciente y el gobierno, incluyen muchos 
componentes diferentes, que varían en tamaño y en el método de control, que 
están influidos en mayor o menor medida por una fuente explícita de control 
ejecutivo, y que a su vez uno influye sobre el otro y sobre el controlador central. 
Su complejidad no significa por supuesto que sean imposibles de estudiar, 
simplemente que no deberíamos esperar respuestas sencillas. 


¿Pero qué constituye el gobierno? Aquí, tiendo a coincidir con Baars al suponer 
que hay alguien o algo, un comité quizás, a cargo de las actividades. Al igual que 
Baars, me alegra, al menos por ahora, asignarle este papel a un alto ministro 


tradicional, aunque restringido constitucionalmente, popularmente conocido 
como el yo. 


16.5. Una base neural del espacio de trabajo cognitivo 


Como Baars remarcó, la idea de que la conciencia forme parte de un sistema que 
funciona como un espacio de trabajo global ha conseguido un gran apoyo en los 
últimos años. Como resultado, es posible desarrollar hipótesis cada vez más 
específicas sobre cómo el cerebro alcanzaría la conciencia, y qué función podría 
desempeñar. Un excelente ejemplo de esto lo proporciona Dehaene y Naccache 
(2001) en su introducción para un volumen especial de la revista Cognition, 
relacionada con la conciencia. 


Dahaene y Naccache comienzan con una serie de supuestos básicos. En primer 
lugar, proponen que es posible procesar cierta información considerable sin la 
intervención de la conciencia, pero cuando la conciencia está implicada, 
demanda atención. Así pues, los recursos atencionales permiten a la conciencia 
ejecutar sus tres funciones básicas, concretamente: (1) prolongar la duración del 
mantenimiento de la información; (2) permitir que la información procedente de 
fuentes diferentes se combinen de modo distinto, y (3) la generación de conducta 
espontánea. Quizá sea relevante apreciar que estas tres funciones se solapan con 
las funciones atribuidas al funcionamiento coordinado del ejecutivo central y el 
búfer episódico de la memoria de trabajo. 


Dahaene y Naccache prosiguen revisando las pruebas de sus supuestos básicos. 
Aunque en algún lugar hemos presentado pruebas de todo esto, dada la 
importancia de sus supuestos, quizá esté justificada la redundancia. Es más, 
como se corresponde con el énfasis neurobiológico, la mayoría de las evidencias 
citadas por Dehaene y Naccache provienen de estudios neuropsicológicos, con 
neuroimagen, o electrofisiológicos, y como tal, complementan la evidencia 
basada en la psicología cognitiva y social presentada en algún momento. 


16.5.1. El procesamiento cognitivo es posible sin conciencia 


Para este supuesto, Dehaene y Naccache confían fuertemente en las pruebas 
neuropsicológicas, concretamente en las pruebas con pacientes con ceguera 
cortical quienes parecen ser capaces de responder apropiadamente a estímulos 
situados en su campo de visión ciega, pero niegan ser conscientes de ellos 
(Weiskrantz, 1997). Se han demostrado fenómenos comparables en una amplia 
serie de campos, incluyendo el reconocimiento de objetos, visión del color, 
lenguaje, percepción, lectura y amnesia (ver Kóhler y Moscovitch, 1997). Un 
ejemplo específico proviene del área de la prosopagnosia, en la que a un paciente 
con daño cerebral le resultaban igual de familiares unas fotografías de sus 
allegados que unas fotografías de completos extraños, pero que sin embargo 
mostraba una respuesta electrodérmica diferente (Bauer, 1984). Más evidencias 
de un procesamiento sin conciencia provienen del estudio de pacientes con 
heminegligencia, quienes tras un daño en el hemisferio derecho, no parecían ser 
conscientes de los objetos situados en su campo de visión izquierdo. Por 
ejemplo, una palabra (e.g., doctor) presentada en el campo ignorado no sería 
captada por el paciente. Sin embargo, fue suficiente con acelerar el 
procesamiento de un ítem relacionado (e.g., enfermera), presentado en el campo 
visual intacto (McGlinchey-Bertoh et al. [1993]), un resultado que amplía las 
evidencias anteriores acerca del procesamiento semántico de palabras 
desenmascaradas de las que no se puede informar conscientemente (Marcel, 
1983). 


16.5.2. La atención es necesaria para la conciencia 


Se sabe desde hace muchos años que los objetos que se presentan visualmente y 
que caen fuera de la zona atendida del campo visual no son captados (Triesman y 
Gelade, 1980). Este punto es acentuado por Mack y Rock (1998), quienes 
pidieron a los sujetos que realizaran una tarea de discriminación visual 
demandante localizada en un punto visual específico. Bajo estas circunstancias, 
los sujetos fracasaron al percibir estímulos que serían fácilmente detectables bajo 
condiciones menos demandantes, por ejemplo, un círculo negro en la fóvea, por 
lo que Mack y Rock concluyeron que «no parece haber percepción consciente 
sin atención» (1998, p. ix). 


Un fenómeno relacionado es la ceguera atencional, por la que los sujetos son 
expuestos a una secuencia de estímulos presentados rápidamente, con la 
instrucción de que informen de un tipo específico de ítem, por ejemplo, 
animales. Los sujetos son capaces de hacer esto incluso a velocidades muy 
rápidas, y pueden identificar más de un ítem siempre que todos estén separados. 
Sin embargo, si el segundo ítem aparece poco después del primero, la detección 
es mucho menos probable (Raymond et al., 1992). Es como si la atención del 
sujeto se viera capturada brevemente por el primer ítem, lo que le lleva a 
perderse los ítems inmediatamente posteriores. Una ilustración más dramática si 
cabe de la importancia de la atención proviene del fenómeno de la ceguera al 
cambio. En este paradigma, mientras que el sujeto camina por la calle es 
detenido por un extraño (el experimentador), con quien comienza una 
conversación. Entonces aparecen dos personas (cómplices) cargando con un 
mural y pasan entre el sujeto y su interlocutor, el experimentador. Mientras que 
el experimentador permanece oculto tras el mural, sufre una serie de cambios 
físicos notables, por ejemplo, se pone un gran sombrero. Los sujetos casi nunca 
perciben el cambio, y cuando se les informa del mismo se muestran incrédulos 
(ver O*Regan et al. , 1999). Por muy grande que sea el sombrero, si el sujeto no 
atiende al estado de la cabeza del experimentador, el cambio de apariencia no 
será percibido. 


16.5.3. Algunas operaciones cognitivas requieren ser consciente 


1. Manteniendo la información. Tal como Sperling (1960) demostró en sus 
clásicos estudios sobre la memoria icónica, aunque puede que tengamos un 
acceso inicial a unas doce letras, solo somos capaces de mantener cuatro, a 
través de un proceso de atención focalizada seguido de repaso. Fuster (1954), 
Fuster y Alexander (1971) y Goldman-Rakic (1957) han demostrado que la 
Capacidad para recordar la localización de un estímulo visual, con el fin de poder 
realizar un movimiento ocular hacia el estímulo unos segundos después, depende 
de la actividad continua de las células dentro de la corteza frontal, un área que 
está fuertemente involucrada en el control de la memoria de trabajo en humanos 
(ver Capítulo 12). 


2. Las combinaciones nuevas requieren conciencia. Esta capacidad, que se ha 


atribuido al funcionamiento del búfer episódico y del ejecutivo central, fue 
estudiada a través de un ingenioso experimento de Merikle et al. (1995). 
Inventaron una variante de la tarea Stroop en la que los sujetos tenían que 
nombrar patrones de colores tan rápido como pudieran. Cada patrón estaba 
precedido por una palabra que designaba un color. Cuando la palabra era 
congruente con el patrón, la tarea de nombrar colores se aceleraba, y cuando era 
incongruente, se reducía la velocidad. Se usaron dos colores, el verde y el rojo. 
En una condición, el 75 por ciento de los indicios eran incongruentes, y bajo 
estas circunstancias, los sujetos se percataban de este sesgo y parecían ser 
capaces de usarlo acelerando así las respuestas incongruentes más frecuentes. 
Por ello, si la palabra rojo era seguida por un patrón verde, los sujetos 
respondían correctamente con «verde» mucho más rápido que si la 
incongruencia se diera menos frecuentemente. 


En otra condición, las palabras sobre colores se ocultaban, haciéndolas aparecer 
inmediatamente antes del patrón, de forma que los sujetos eran incapaces de 
informar de la palabra que se había presentado. A pesar del enmascaramiento, 
seguía dándose el clásico efecto Stroop, de forma que una palabra incongruente 
dificultaba que se pronunciase el color siguiente, sugiriendo que, a pesar de la 
falta de conciencia, la palabra sí había sido procesada. En estas circunstancias, 
los sujetos no fueron capaces de beneficiarse de la condición en la que los 
indicios incongruentes aparecían un 75 por ciento de las veces. En un estudio 
posterior de Merikle y Joordens (1997), aunque las palabras no se enmascararon, 
los sujetos tampoco obtuvieron beneficio estratégico del sesgo cuando las 
palabras se presentaron fuera del foco de atención. 


Finalmente, es de destacar que los pacientes con heminegligencia nunca inician 
conductas en respuesta a estímulos dentro de su campo de visión ciega. A pesar 
de las evidencias que indican que hasta un cierto nivel sí son capaces de acceder 
a la información sobre ese estímulo, no pueden usar esta información 
estratégicamente. De forma semejante, los pacientes amnésicos son muy capaces 
de demostrar un aprendizaje implícito normal, pero no son conscientes de lo que 
han aprendido, y por tanto no pueden usarlo intencionadamente. Esto tiene un 
efecto importante sobre su capacidad para vivir una vida normal, acentuando la 
importancia del conocimiento explícito para un funcionamiento eficiente del 
espacio de trabajo mental. 


16.5.4. Un marco de trabajo teórico 


Dehaene y Naccache basan su marco de trabajo interpretativo en tres supuestos 
básicos: (1) la mente es modular, (2) la conciencia es no-modular, (3) la atención 
se puede usar para movilizar y amplificar procesos neurales. Los discutiremos 
por orden. 


16.5.4.1. Modularidad de la mente 


Dehaene y Naccache proponen que «un proceso dado, que incluya varias 
operaciones mentales, puede proceder inconscientemente solo si está disponible 
un conjunto de sistemas modulares interconectados para poder realizar cada una 
de las operaciones requeridas» (Dehaene y Naccache, 2001, p. 12). Sugieren, por 
ejemplo, que es posible que una cara enmascarada y de miedo dé lugar a un 
priming inconsciente, porque hay sistemas neurales especializados en el colículo 
superior, pulvinar, y en la amígdala derecha que se encargan de atribuir un 
priming emocional a las caras (Morris et al. , 1999). También asumen que 
probablemente muchos de estos sistemas funcionen en paralelo, y puede que se 
den en una serie de niveles diferentes, desde funciones básicas como el priming 
emocional y el control postural hasta el funcionamiento de las habilidades de 
aprendizaje como la lectura, que se basa en un complejo procesamiento 
cognitivo de alto nivel. 


16.5.4.2. Conciencia no-modular 


En contraste con esta amplia serie de procesos modulares implícitos, ellos 
proponen que «la mente consciente es no-modular, y comprende un sistema 
neural distribuido o «espacio de trabajo» con una conectividad a larga distancia 


que puede interconectar potencialmente múltiples áreas cerebrales especializadas 
de forma coordinada aunque variable» (Dehaene y Naccache, 2001, p. 13). 
Aunque este sistema no es modular, se encarga de realizar conexiones entre 
muchos sistemas que son en sí mismos modulares. Ellos sugieren que al menos 
cinco tipos de sistemas deben interconectarse para que el espacio de trabajo 
global funcione adecuadamente. Entre ellos se incluyen: 


1. Sistemas perceptivos de mayor nivel; 
2. Sistemas motores; 

3. Memoria de trabajo a largo plazo; 

4. Procesos evaluativos, y finalmente, 


5. Control atencional. 


Supón que tomamos como ejemplo el caso de un antiguo amigo que nos envía 
una carta en la que nos dice que va a venir a visitarnos. Necesitamos percepción 
visual para identificar las palabras en la página y el control motor para mover 
nuestros ojos apropiadamente. Se necesita acceso a varios tipos de memoria a 
largo plazo, incluyendo la memoria léxica y semántica para interpretar la frase, y 
probablemente también autobiográfica y episódica para asimilar el significado 
de la carta. A su vez, es probable que esto tenga un componente evaluativo, que 
esperamos que sea una anticipación agradable de volver a encontrarte con tu 
amigo. Finalmente, todo este proceso dependerá del control atencional, que te 
permitirá centrarte en la tarea de leer la carta e interpretar su significado, en vez 
de ponerte a rememorar viejos tiempos. 


16.5.4.3. Control atencional de los procesos neurales 


Esto nos lleva al tercer supuesto de Dehaene y Naccache, en relación a la 


capacidad de la atención para movilizar y amplificar procesos neurales. 
Proponen que «la amplificación atencional de arriba abajo, es el mecanismo por 
el cual los procesos modulares se pueden movilizar temporalmente y estar 
disponibles para el espacio de trabajo global, y por tanto para la conciencia» 
(Dehaene y Naccache, 2001, p. 14). Proponen que el procesamiento solo se 
volverá consciente si se amplifica y mantiene durante un período de tiempo 
mínimo. Dentro del modelo de memoria de trabajo actual, esto se podría 
considerar como el uso del ejecutivo central para asegurarse el almacenamiento 
en el búfer episódico. Dado que este proceso se puede dar a lo largo de muchos 
sistemas modulares diferentes, sugieren que este proceso defiende «la ausencia 
de una localización anatómica precisa para el sistema del espacio de trabajo» ( 
ibid., p. 14), un enfoque que también es similar a los supuestos que subyacen al 
búfer episódico (Baddeley, 2000). 


16.5.5. El sentido del yo 


Dehaene y Naccache también incorporan el sentido del yo dentro de su marco de 
trabajo. Proponen que cada cerebro tiene múltiples representaciones de sí mismo 
a distintos niveles, que van desde mecanismos homeostáticos subcorticales 
básicos a través de la representación del cuerpo a nivel somático, cinético y 
motor hasta una representación personal de nuestro concepto corporal y de 
nuestra cara, y estas representaciones de memoria a largo plazo como memorias 
autobiográficas y episódicas. Cada una de estas se considera como un sistema 
modular separable, pero que se puede volver accesible a través del espacio de 
trabajo global de la conciencia, y dentro de ese espacio de trabajo pueden 
interaccionar con otros módulos. Estas representaciones pueden funcionar 
mediante el razonamiento y mediante la manipulación verbal, y por tanto usarse 
para planificar acciones futuras. Por poner un ejemplo trivial, la decisión de 
probar otro trozo de pudin probablemente esté influida por el estado del cuerpo, 
«¡estoy lleno, pero estaba delicioso!»; factores sociales, «¿pareceré un glotón? 
¡No, simplemente demostraría lo mucho que aprecio la comida del anfitrión!»; 
planes futuros, «debería comer menos, pero, ¿por qué voy a empezar ahora 
mismo?», y acción, «¡sí, por favor!». Estas múltiples capas de representación del 
self, cada unas de las cuales se pueden activar, mantener y manipular, 
proporcionan una base posible para nuestra capacidad de reflexión o de una 


conciencia de alto nivel. 


16.6. Conciencia y memoria de trabajo 


Este capítulo se ha concentrado en un particular enfoque para tratar la desafiante 
cuestión sobre cómo explicar la conciencia. El enfoque se basa en el supuesto de 
que la conciencia sirve de espacio de trabajo mental, y que la experiencia 
fenomenológica que acompaña a la conciencia proporciona un componente 
importante de su función, permitiendo diferentes niveles de representación, lo 
que permite registrar múltiples estímulos de forma simultánea. La disponibilidad 
de los múltiples niveles se combina con la capacidad de reflexividad, la 
habilidad para representar y manipular los contenidos de un nivel sobre otro. 
Esto proporciona un mecanismo muy poderoso para registrar el medio y 
relacionarlo con la experiencia pasada, lo que a su vez puede usarse para 
modelar el presente, usando ese modelo para simular y por tanto predecir el 
futuro y planificar la acción futura. En el corazón de este sistema descansa la 
Capacidad para el almacenamiento temporal y la manipulación de información 
que es el distintivo de la memoria de trabajo. 


El modelo multicomponente de la memoria de trabajo evolucionó a partir del 
intento de responder a una cuestión mucho menos ambiciosa que la naturaleza de 
la conciencia. Comenzamos cuestionándonos si era necesario tener sistemas de 
almacenamiento a largo y corto plazo, y si era así, preguntarnos qué función 
podían tener. No hicimos mención alguna a la fenomenología, aunque debo 
admitir que consideraba a la agenda visoespacial como el asiento de la 
experiencia fenomenológica de las imágenes visuales, y al ejecutivo central 
como el controlador atencional de alguna forma de espacio de trabajo mental. 
Por tanto, implícitamente, estábamos haciendo supuestos sobre dos de las 
cuestiones básicas asociadas con la conciencia, concretamente la naturaleza del 
qualia, el término filosófico para la experiencia consciente, como por ejemplo la 
particular rojez de una rosa, mientras que al mismo tiempo sirve como sistema 
implicado en el control explícito de la acción. 


Nuestro de alguna manera intento por abordar el papel de la memoria de trabajo 
en la conciencia comenzó con una serie de experimentos que investigaban el 


papel de los subsistemas visoespacial y fonológico subsidiarios de la memoria de 
trabajo en las imágenes visuales y auditivas, tal como se describe en el Capítulo 
5 (Baddeley y Andrade, 2000). Nos agradó descubrir que éramos capaces de 
obtener datos coherentes y significativos a partir de juicios subjetivos de viveza, 
y de dar respuestas provisionales a las cuestiones iniciales. Estábamos algo 
sorprendidos al descubrir que los subsistemas fonológico y visoespacial jugaban 
un papel relativamente pequeño en las imágenes visuales, excepto cuando se 
necesitaban para mantener información temporal. En aquellos momentos nuestro 
concepto de ejecutivo, carecía de una capacidad de almacenamiento explícito, y, 
por tanto, no era apropiado para rellenar el hueco teórico. Este fue uno de los 
resultados que nos llevó a postular un nuevo componente de la memoria de 
trabajo, el búfer episódico. 


El búfer se diferencia de nuestro concepto previo del ejecutivo central en que es 
principalmente un dispositivo de almacenamiento multidimensional, controlado 
activamente por el ejecutivo. Tal como se describió en el Capítulo 9, estamos 
investigando actualmente la importancia del control ejecutivo en el 
funcionamiento de nuestro hipotético sistema del búfer, y hemos encontrado un 
mayor grado de control automático del que habíamos anticipado inicialmente. Es 
probable que el búfer sea un sistema de capacidad limitada para albergar 
representaciones, estando su capacidad potencialmente incrementada por el 
agrupamiento multidimensional de segmentos de información. Estamos 
investigando las condiciones bajo las cuales estos segmentos se crean de forma 
automática, en vez de demandar recursos ejecutivos atencionalmente limitados. 
Independientemente de la respuesta, o más probablemente de las respuestas, a 
estas cuestiones esperamos que el concepto de sistema de almacenamiento 
multidimensional siga siendo un componente necesario para el modelo de la 
memoria de trabajo. 


El segundo rasgo de la conciencia, su capacidad para servir como un espacio de 
trabajo de capacidad limitada, fue parte, de manera más explícita, del modelo 
multicomponente original de la memoria de trabajo. De hecho, el término 
«memoria de trabajo» se eligió para acentuar su carácter funcional. Nuestro 
modelo se diferencia sin embargo de los modelos de conciencia previamente 
descritos en que contiene una serie de componentes que casi con toda seguridad 
no son explícitamente conscientes. Por ejemplo, el bucle fonológico depende del 
repaso que a su vez refleja hábitos de lenguaje existentes y procesos 
articulatorios, algunos, pero en ningún caso todos los que podrían estar 
explícitamente disponibles para la reflexión consciente. Una de las ventajas del 


bucle es que el repaso parece necesitar un control consciente mínimo, 
permitiendo que la conciencia pueda ser utilizada para maximizar otros aspectos 
del procesamiento. Por ello, aunque me inclinara a identificar al búfer episódico 
con la representación de sucesos que están actualmente en la conciencia, mucha 
de la maquinaria que alimenta el búfer no está probablemente abierta en sí 
misma a la manipulación consciente. Al subrayar este punto no estoy criticando 
los enfoques de la conciencia previamente descritos, sino más bien señalando 
énfasis distintos. El trabajo que he descrito anteriormente se centra en el 
fascinante e importante tema de la comprensión de la conciencia y el control. En 
mi caso, me estoy centrando en un sistema de almacenamiento y manipulación 
de información que incidentalmente, pero de forma importante, contiene un 
componente que se supone que subyace a nuestra capacidad de conciencia. La 
capacidad de conciencia reflexiva es central para nuestra habilidad de 
sobrellevar de forma flexible y creativa un mundo complejo y cambiante. Sin 
embargo, solo es un componente de un complejo sistema; un organismo que 
estuviera encerrado en sí mismo no habría sobrevivido mucho tiempo. Para ser 
efectivos, el pensamiento tiene que llevar a la acción, mientras que muchas de 
nuestras acciones parecen proceder sin un control consciente. La compleja y sutil 
relación entre pensamiento y acción constituye el tema del siguiente capítulo. 


Notas al pie 


* Siglas del inglés: «Wessex Head Injury Monitor», N, de la T. 


CAPÍTULO 17 


El control multinivel 


En este capítulo nos trasladamos desde las altas esferas de la conciencia hasta 
una cuestión aparentemente más mundana relacionada con el control del 
movimiento. Digo aparentemente mundana, porque primero espero convencerte 
de que el control del movimiento activo es un área de investigación rica e 
intrigante, y después, de que contiene en sí misma cuestiones centrales sobre 
cómo se relacionan el pensamiento y la acción. 


El estudio del control del movimiento ha sido un área muy activa en los últimos 
años, aunque mucho del trabajo parece haberse concentrado a un nivel 
biomecánico, o dirigido por un enfoque neo-Gibsoniano, con escasa atención a 
la importancia de las representaciones internas, como los esquemas, o a los 
conceptos cognitivos como el SAS de Shallice (Kelso, 1995; Shaw, 2003; 
Turvey, 2004). Esto no quiere decir que no sea importante hacer un análisis 
detallado a nivel perceptivo-muscular, sino simplemente sugiere que puede ser 
necesario un nivel de análisis mayor, incluso para dar cuenta de una tarea tan 
aparentemente sencilla como coger un vaso y bebértelo. 


En los últimos años, los trastornos de la acción han constituido una rica e 
intrigante área en los estudios neuropsicológicos. Primero revisaremos una serie 
de evidencias disponibles, seguidas de una interpretación ofrecida por Frith et al. 
(2000), que está fuertemente basada en la distinción entre fuentes de control 
automáticas y no automáticas. Ellos proponen una teoría que explícitamente va 
más allá del control motor y que cubre el control de la acción de forma más 
general, incluyendo la conducta social como una especie de acción. Comenzaré 
discutiendo las fuentes de evidencia que son ampliamente consistentes con el 
argumento de Bargh acerca de la importancia del control implícito, para seguir 
considerando pruebas cuya interpretación parece ser insuficiente, lo que nos 
llevará a perfilar el modelo de Frith et al. (2000). 


17.1. Control implícito de la acción 


Tendemos a creer que nuestras acciones son intencionales y explícitas, 
controladas por nuestras necesidades, deseos e intenciones, a diferencia del 
acento que ponen Bargh y Ferguson (2000) en los indicios externos de las 
respuestas automáticas. Existe una gran cantidad de evidencias que sugieren que 
los indicios implícitos del tipo discutido por Bargh pueden ser de hecho 
importantes para el control del movimiento. Frith et al. defienden que las 
pruebas neuropsicológicas, con pacientes en los que el control de la acción se 
encuentra deteriorado, nos ofrecen una buena explicación acerca de cómo se 
controlan normalmente nuestras acciones. Consideraremos los siguientes 
ejemplos. 


17.1.1. Estimulación cerebral y movimiento 


Como Bargh y Ferguson apuntan, es posible generar una acción estimulando un 
área concreta de la corteza (Penfield, 1958). La estimulación del núcleo talámico 
central en un paciente consciente le lleva a apretar sus puños (el paciente no 
tiene ni idea de por qué realiza esta acción). Por supuesto, esto simplemente 
significa que es posible intervenir en el sistema general, e influir en el 
movimiento sin necesidad de una iniciativa activa. Como veremos, se puede 
obtener el mismo efecto incluso a un nivel más periférico, haciendo vibrar los 
músculos extensor y flexor del brazo. 


17.1.2. Conducta de utilización 


Algunas veces, los pacientes con un daño bilateral en los lóbulos frontales 
muestran una conducta que parece estar excesivamente guiada por las 
condiciones estimulares inmediatas. Un paciente así, al ver una caja de cerillas 
sobre la mesa, puede coger una cerilla espontáneamente y encenderla. Si la taza 


de café del doctor está sobre la estantería, el paciente beberá de ella alegremente. 
Al preguntarle de quién es el café, el paciente responderá correctamente, y si se 
le pregunta por qué bebió, sin vergiienza alguna responderá que porque tenía 
sed. 


L'Hermite (1983) fue el primero en estudiar la conducta de utilización en detalle. 
Él describe ciertos ejemplos sorprendentes de este tipo de conducta socialmente 
anómala. En una ocasión, habían dejado una serie de herramientas del equipo 
médico sobre la mesa, entonces vio a una mujer de 52 años. Ella cogió una 
jeringuilla y al mismo tiempo el intrépido doctor L'Hermite se quitó su chaqueta 
y su camiseta ¡y entonces ella se la inyectó! En otra ocasión, un paciente que 
visitaba el apartamento del doctor vio su habitación con la cama deshecha. De 
pronto, el paciente se desvistió, se quitó la peluca y se metió en la cama. 


Shallice et al. (1989) describen una investigación sistemática posterior acerca de 
la conducta de utilización, en ella se establece que esta conducta pertenece a una 
serie de síntomas del síndrome disejecutivo que puede que aparezca tras un daño 
en el lóbulo frontal. Una característica de la conducta de utilización es que el 
paciente no niega la acción, ni admite que sea algo que no pueda evitar, sino que 
lo justifica como algo lógico. Las acciones son típicamente parte de un patrón 
sobreaprendido que está fuertemente ligado a ciertos aspectos de la situación 
estimular. El vínculo puede darse a un nivel relativamente bajo, como encender 
una cerilla, donde el paciente simplemente está reflejando lo que Gibson 
denominaría como la affordance* del objeto, es decir su potencial de uso. Esta 
affordance incluiría una conducta bastante compleja, como en el caso de la 
jeringuilla. Por supuesto, se da el caso de que los objetos también tienen 
affordances para los sujetos normales. Las affordances juegan un papel 
importante en la capacidad para manejarse en un medio rico y complejo. Sin 
embargo, presumiblemente, en casos normales, se inhibe el desencadenamiento 
de la conducta facilitada que es socialmente inapropiada, por convención social, 
o porque la acción está dominada por otra con un plan o un guion de un nivel 
superior, por ejemplo, el guion «echar un vistazo a la casa de alguien», en vez 
del guion «irse a la cama». 


17.1.3. El síndrome de Tourette 


En este caso, la conducta se exhibe como si estuviera impulsada por un poderoso 
estímulo externo al control del paciente. Puede que el paciente sea incapaz de 
controlar la necesidad de realizar movimientos esporádicos, aparentemente 
inútiles, como tics, O la pronunciación de palabras irrelevantes, que a menudo 
son obscenas, lo que resulta bochornoso para el paciente. La conducta se puede 
suprimir con un esfuerzo considerable, pero tienden a surgir a medida que 
aumenta la presión para responder. A menudo el paciente es completamente 
consciente de que su conducta es irracional, pero le resulta imposible reprimirla. 


17.1.4. Lapsus de acción 


Por supuesto, realizar una acción inapropiada por causa del ambiente no es 
exclusivo de los pacientes con daños en el lóbulo frontal. Reason y Mycielska 
(1982) estudiaron estos lapsus mentales detalladamente, usando principalmente 
diarios y autoinformes. Los ejemplos típicos incluían ponerse de camino al 
supermercado un sábado por la mañana y encontrarse conduciendo de camino al 
trabajo. William James (1890) describe un ejemplo no tan distinto del paciente 
de L'Hermite, aunque menos raro. Esta persona en cuestión subió las escaleras 
para vestirse y salir a cenar, y tras haberse quitado la ropa de diario, se puso 
distraídamente su pijama y se fue a la cama. 


Por supuesto, el modelo SAS de Norman y Shallice fue explícitamente 
desarrollado para dar cuenta de esta conducta, así como de la conducta de los 
pacientes con daños en el lóbulo frontal. Sugieren que estos lapsus de acción 
reflejan el control de la conducta por medio de estímulos ambientales externos, 
una interpretación que es completamente consistente con la tesis de Bargh y 
Ferguson. Sin embargo, estos ejemplos de despistes se diferencian de la 
conducta de utilización del paciente en que el perpetrador del error suele sentirse 
abochornado al salirse de lo que consideran que es el habitual control atencional 
y explícito de sus acciones, mientras que los pacientes tienden a considerar su 
conducta como si fuera perfectamente normal. 


17.1.5. Visión ciega 


En todos los ejemplos citados anteriormente, el sujeto era consciente del 
estímulo que guiaba su conducta, y el problema estribaba en la dificultad para 
inhibir una respuesta asociada pero inapropiada. Un intrigante trabajo de Marcel 
(1998) señala que no es necesaria la conciencia explícita para que aparezca esta 
función directora. Marcel describe una serie de experimentos con el paciente 
G.Y., que padecía visión ciega. Este trastorno aparece cuando los pacientes 
sufren ceguera en una parte de su campo visual como resultado de un daño en el 
lóbulo occipital de la corteza (Weiscrantz, 1986). Estos pacientes negarán poder 
ver cualquier cosa situada en el área ciega, pero si se les pide que adivinen, 
podrán detectar la presencia del estímulo con una tasa de acierto muy por encima 
del nivel de azar. 


Marcel estudió la capacidad de G.Y. para alcanzar y tocar un objeto situado 
dentro de su campo ciego. No solo fue capaz de hacerlo, sino que además, 
cuando el objeto cambiaba de forma, G.Y. era capaz de configurar su mano 
apropiadamente, adecuándola de forma distinta según fuera una vara horizontal 
o vertical. A pesar de esto, el paciente era incapaz de informar conscientemente 
de la forma u orientación del objeto. Era como si la mano «supiera» lo suficiente 
como para hacer los ajustes necesarios, pero como si este conocimiento no 
estuviera accesible para la conciencia. En otro estudio (Marcel, 1993), se planteó 
si el paciente podía usar la forma adoptada por su mano justo antes del contacto 
como pista para conocer la forma del objeto. Sin embargo, aunque G. Y. fuera 
Capaz de informar de la forma del objeto que hubiera cogido, presumiblemente 
usando pistas táctiles y hápticas, si el proceso se interrumpe después de que la 
mano haya adoptado la forma correcta, pero antes de que se haya producido el 
contacto con el objeto, el paciente no puede usar la orientación de la mano como 
indicio para predecir la forma del objeto que está a punto de agarrar. Este hecho 
es consistente con otras evidencias que se discutirán más tarde, al sugerir que no 
tenemos un buen acceso consciente a la información concreta que estamos 
usando para realizar secuencias de acciones familiares pero complejas. 


17.1.6. Anosognosia 


Mientras que la visión ciega ofrece un ejemplo del uso de la información 
aparentemente inconsciente, con la anosognosia ocurre lo contrario, los 
pacientes aseguran haber realizado un movimiento cuando no lo han hecho, y 
además son incapaces de mover el miembro en cuestión. A menudo los pacientes 
con daños cerebrales que conllevan trastornos cognitivos son conscientes de sus 
problemas, pero aparentemente en ocasiones pueden parecer completamente 
inconscientes de su capacidad. Esto no parece reflejar una negación freudiana, y 
se asocia típicamente con un daño en el hemisferio derecho del cerebro. Por 
tanto, casi siempre afecta al miembro izquierdo y no al derecho, sugiriendo un 
origen orgánico en vez de psicodinámico. Bisiach y Geminiani (1991) describen 
pacientes que han perdido su capacidad para mover su brazo como consecuencia 
de una lesión cerebral, aunque conservan la capacidad para percatarse del hecho 
de que lo movieron pasivamente cuando tenían los ojos vendados. Cuando se les 
pide que muevan su brazo, aseguran, erróneamente, haberlo hecho ya. Un 
paciente anosognósico con una pierna ortopédica, completamente incapaz de 
andar, puede declarar ser capaz de subir las escaleras o de correr para coger el 
autobús. 


La anosognosia no está limitada en absoluto a la conducta motora: no es raro 
encontrarla en la amnesia; por ejemplo, un paciente profundamente amnésico 
que yo estudié, interrumpía el experimento para remarcar que se enorgullecía de 
su memoria, olvidando que ya lo había comentado múltiples veces. De hecho, 
los pacientes pueden negar incluso condiciones tan aparentemente obvias como 
la ceguera (Antón, 1899). Por tanto, aunque la anosognosia para el deterioro de 
movimientos existe, no está en absoluto limitada a un control defectuoso de la 
acción y, por tanto, probablemente requerirá una explicación más amplia que la 
que se ofrece aquí. 


Muchos de los ejemplos observados reflejan un comportamiento que es anómalo 
para el observador, pero no para el paciente. Por ello, aunque estos casos ofrecen 
un reto explicativo intrigante, se podrían ver como un amplio apoyo a la 
propuesta de Bargh y Ferguson de que la conducta refleja la respuesta del sujeto 
a los indicios ambientales o internos. Este enfoque es menos fácil de sostener a 
la luz del fenómeno que describiremos más adelante. Se describirán casos en los 
que las acciones realizadas son anómalas tanto para el observador como para el 
paciente o el sujeto, involucrando dos o más niveles de control que parecen estar 
en conflicto, uno explícito y el otro implícito, y a menudo «no deseado» por el 
paciente. Comenzaremos con el extraño fenómeno del miembro fantasma. 


17.1.7. Miembro fantasma 


Un paciente con un miembro amputado puede seguir experimentándolo, incluso 
aunque sea visualmente obvio que el miembro ya no está presente, y que por 
tanto se trata de algún tipo de ilusión. La ilusión puede ser bastante dañina ya 
que el miembro puede seguir sintiendo dolor o picor, sin que por supuesto exista 
la posibilidad de rascarte (Ramachandran y Hirstein, 1998). Los pacientes 
pueden tener inicialmente la capacidad para «mover» el miembro fantasma, pero 
a menudo pierden esta aparente capacidad con el tiempo. También se da el caso 
de que la estimulación de cualquier otra parte del cuerpo, como la cara, puede 
sentirse como si les tocaran el miembro fantasma. Ramachandran atribuye la 
anómala localización de la sensación en otra parte del cuerpo a la regeneración 
neural, por la cual las áreas del cerebro que antes estaban conectadas con el 
brazo o con el dedo ahora ausentes son tomadas por sistemas neurales que se 
encargan de otras partes del cuerpo controladas por áreas corticales adyacentes a 
aquellas áreas que antes se encargaban del miembro que falta. 


Otra experiencia perceptiva anómala es la de los miembros supernumerarios. 
Hari et al. (1998) describen un paciente con el brazo izquierdo defectuoso, que 
experimentaba dos brazos izquierdos siempre que se le pedía que moviera su 
brazo defectuoso mientras que miraba para otro lado. Un brazo parecía seguir 
localizado en su posición inicial y el otro en la posición nueva. Al mirar su brazo 
o tocarlo, el brazo «antiguo» desaparecía. Este paciente, que parecía incapaz de 
actualizar la posición del brazo cuando este se movía, tenía un daño en el área 
motora suplementaria (AMS) y en el frontal derecho junto con alguna evidencia 
de anormalidad congénita en el cuerpo calloso, la estructura que facilita la 
comunicación entre los dos hemisferios del cerebro. 


Un tercer trastorno es el de la mano alienígena (Banks et al., 1989). Este aparece 
en casos de apoplejía en los que una mano y un brazo están paralizados. En 
ocasiones, los pacientes niegan ser los dueños de su brazo y de su mano en 
cuestión, llegando incluso a intentar sacárselo y acusar al cirujano de haberles 
cosido el brazo o la mano de otra persona. Como en la anosognosia, este 
trastorno está asociado típicamente a un daño en el hemisferio derecho. 


Los casos que hemos discutido hasta ahora incluyen una percepción anómala, 
experiencias que son tan extrañas para el paciente como para el observador que 
las escucha mencionar. Más extraño aún son los síntomas de mano anárquica, en 
los que la anomalía se extiende más allá de la percepción hasta la acción, y 
donde la mano del paciente se comporta como si tuviera voluntad propia. 


17.1.8. La mano anárquica 


Della Sala et al. (1994) han revisado cerca de 39 casos procedentes de la 
literatura y de sus propios archivos. Describen el caso característico de G.P., que 
había participado en una comida con su familia y con el neurólogo interesado en 
su Caso. De pronto, a la mitad de la comida, su mano izquierda alcanzó un 
montón de espinas de pescado del plato de su vecino; entonces, la mano 
comenzó a clavárselas en la boca del propio paciente, para pesar suyo. Más 
tarde, en la comida, la traviesa mano alcanzó el helado de su hermano), la 
paciente intentó tomar el control con la otra mano, lo que terminó con el helado 
en el suelo. En otros ejemplos, Parkin (1996) describe a un paciente que 
experimentaba regularmente un conflicto entre las dos manos. Así, en una 
ocasión, la mano derecha intentaba abotonarse el vestido mientras que la 
izquierda se ocupaba de desabotonarlo; cuando la mano derecha intentaba poner 
un canal de televisión, la izquierda interfería y lo cambiaba. Un caso aún más 
extremo es el descrito por Banks et al. (1989): la mano anárquica de una 
paciente que intentó estrangularla, una vez incluso mientras dormía, obligándola 
a atarse la mano cuando se iba a la cama. 


Aunque estas extrañas acciones podrían sugerir cierta interpretación psicogénica 
o freudiana parecen ser resultado de una lesión específica en la pared media del 
lóbulo frontal contralateral a la mano alienígena. Como en muchos trastornos del 
control de la acción, está implicado el AMS, a menudo junto con evidencias de 
un daño cortical más general. En casi todos los casos descritos hasta el 
momento, la percepción o la conducta anómala se ha asociado con un cierto 
daño cerebral. Los últimos ejemplos consistirán en ilusiones que afectan al 
control motor en personas normales. 


17.1.9. Conflicto entre la mano y el ojo 


Goodale et al. (1986; 1991) utilizaron la ilusión de Titchener para explorar un 
poderoso conflicto entre el control por la mano y el ojo. La ilusión se basa en el 
hecho de que el tamaño aparente de un objeto, como un círculo, está influido por 
su contexto. Por tanto, dados dos círculos de igual tamaño, uno rodeado por 
círculos pequeños y el otro por círculos grandes, este último parecerá más 
pequeño. Goodale et al. modificaron la ilusión presentando una serie de discos y 
pidiéndole al sujeto que cogiera el disco central. Bajo estas circunstancias, la 
mano se abre para adaptase al tamaño correcto de los discos antes de cogerlos, 
no al tamaño percibido. Es como si, por tanto, la mano tuviera una fuente de 
evidencia que fuera más fiable que la que proporciona la percepción consciente. 
Como los dedos no llegan a tocar los discos, la información es presumiblemente 
visual, pero implícita. Esto por supuesto nos recuerda al paciente con visión 
ciega descrito previamente, que era Capaz de adecuar su mano a la forma 
correcta de un objeto para poder cogerlo, pero era incapaz de decir 
conscientemente de qué objeto se trataba (Marcel, 1998). 


17.2. Un modelo de control motor 


Siguiendo la tradición iniciada por Kenneth Craik durante la Segunda Guerra 
Mundial (Craik, 1947), Frith et al. (2000) han usado conceptos de ingenieros 
serbios para crear un modelo de control de la acción. Se basan en el modelo de 
control motor propuesto por Wolpert et al. (1995) que implica dos conceptos 
básicos, el de predicción, por el cual se representa el estado que se tiene que 
lograr, y el de control, por el cual se proporcionan órdenes motoras que son 
necesarias para alcanzar el resultado deseado. También proponen la existencia de 
al menos tres estados del sistema. 


17.2.1. Procesos predictivos y control motor 


Los predictores, o modelos hacia delante, son necesarios para anticipar el 
movimiento y compensar el cambio sensorial que inevitablemente se dará 
durante el movimiento. Cuando movemos nuestros ojos, cambia el patrón de 
excitación sobre la retina. Entonces, para corregir nuestra percepción del mundo 
se usa una copia eferente de la orden de movimiento. Si no tuviéramos esta 
capacidad para permitir el movimiento, el mundo parecería inestable, se movería 
como se mueven nuestros ojos. Esto se puede demostrar fácilmente moviendo 
nuestro ojo a la vez que nos apretamos el párpado ligeramente. De este modo el 
mundo parece moverse al mismo tiempo. El movimiento del ojo es involuntario, 
y, por tanto, no se le envía al sistema una copia eferente del movimiento. Los 
movimientos voluntarios proveen al sistema de esta información eferente, 
permitiéndonos filtrar los efectos del movimiento y mantener la precisión en una 
tarea como alcanzar un vaso mientras que desplazamos nuestra vista. 


Wolpert et al. asumieron que la acción sigue estando monitorizada mediante la 
comprobación de que la información sensorial que fluye al sistema es de hecho 
la predicha. Si ocurriera un desequilibrio entre la retroalimentación predicha y la 
observada, entonces podría ser necesario modificar la acción para compensarlo. 
Por tanto, si el vaso estuviera en una ligera pendiente y hubiera comenzado a 
deslizarse, entonces el brazo podría estirarse más para tener esto en cuenta. Estas 
modificaciones requieren otro componente del proceso, concretamente los 
controladores. 


Los controladores implican modelos inversos en lugar de modelos hacia delante. 
Proporcionan órdenes motoras, reciben información, como, por ejemplo, dónde 
se desea que termine el movimiento, y llevan a cabo las órdenes de la 
articulación y del músculo necesarias para poder lograrlo. Wolpert propone que 
lo hacen usando lo que él describe como «la estrategia divide y vencerás» 
(Ghahramani y Wolpert, 1997; Wolpert y Kawato, 1998). Él asume que existen 
múltiples controladores, cada uno de ellos cuidadosamente sintonizados con un 
contexto sensoriomotor específico. Se supone que trabajan juntos, 
probablemente sobre una base jerárquicamente organizada, y en la que los 
procesos de resolución de conflictos se usan cuando más de un subprograma 
pudiera ser potencialmente inapropiado. 


Se proponen dos procesos distintos. El primero de todos, lo que Gibson (1979) 
denomina como las «affordances» de los objetos que se emplean para moldear la 
acción. La affordance es la capacidad de un objeto para ser usado de una forma 
determinada. Por tanto, la affordance que ofrece una silla sería sentarse, pero 


también podría servir de mesa o usarse para subirte a ella y alcanzar una 
estantería alta. Por tanto, las affordances son considerablemente más ricas y más 
complejas que las simples características del estímulo, o de los objetos, 
reflejando incluso el uso potencialmente creativo de la experiencia pasada del 
organismo. Por ejemplo, considera la tarea de coger un huevo. Su forma 
determinará la disposición del agarre, probablemente rodeándole con los dedos 
para impedir que su suave superficie se rompa. El conocimiento de la fragilidad 
del huevo también determina cómo de fuerte tenemos que agarrarle, un hecho 
que también estará determinado, por supuesto, por lo que se espera que pese el 
huevo. Cualquier discrepancia entre el movimiento predicho y el esperado se 
usará entonces para modificar la acción. Así, si el huevo resultara estar hecho de 
algún metal extremadamente pesado, entonces se debería agarrar con más fuerza. 


Se supone que el control del movimiento depende de no menos de cinco 
representaciones independientes. En primer lugar, debería representarse el estado 
deseado. En segundo lugar, el estado predicho que permitirá que esto sea 
monitorizado. Para alcanzar este estado, dentro del sistema tienen que registrarse 
las órdenes motoras necesarias, así como la retroalimentación motora apropiada. 
Finalmente, el estado actual del sistema en un momento dado se puede obtener 
comprobando la correspondencia entre las órdenes motoras y la 
retroalimentación sensorial resultante. 


17.2.2. El papel de la conciencia 


No toda esta información es necesariamente accesible a la conciencia subjetiva. 
Las affordances que ofrece el estímulo dentro del ambiente pueden ser 
inaccesibles a la reflexión consciente, al igual que las órdenes motoras. Goodale 
et al. (1985; 1991) estudiaron una tarea de puntería en la que el objetivo saltaba 
de vez en cuando mientras que el sujeto estaba respondiendo. Los sujetos 
ajustaban su puntería, pero no parecían apreciar el ajuste realizado. 


Por supuesto, existe una amplia evidencia de que podemos ser conscientes de 
nuestros movimientos, no solo de los movimientos que realmente hacemos, sino 
también de los movimientos que imaginamos. En el caso de la práctica mental, 
imaginar repetidamente que se realiza una acción, como un tiro a canasta, puede 


llevar a una mejora en el rendimiento (Feltz y Landers, 1983). Esta práctica 
mental puede llevar a cambios físicos, como cuando al imaginar ejercicios con 
las piernas se incrementa la tasa cardíaca y la respiración (Decety et al. , 1991). 
Imaginar el movimiento de una palanca activa la misma área del cerebro que si 
se hiciera realmente el movimiento (Stephan et al. , 1995). De forma similar, 
preparar un movimiento y mantenerlo dispuesto implica áreas del cerebro 
similares a las implicadas en imaginar un movimiento (Jeannerod et al. , 1995), 
principalmente cuando está implicado el AMS (Stephan et al. , 1995). 


Sin embargo, el conocimiento del estado actual del sistema de control motor es a 
menudo implícito. Cuando la retroalimentación es tal como se predijo, el sujeto 
puede ser ajeno a ella; sin embargo, las personas son mucho más proclives a 
percibir la disonancia entre el estado deseado y el esperado. Las cosquillas son 
un intrigante ejemplo de esto; en este caso, cuando a una persona le hacen 
cosquillas, se vuelve sumamente consciente de una oleada impredecible de 
estimulación táctil. La estimulación deja de ser impredecible cuando intentas 
hacerte cosquillas a ti mismo, en este caso el efecto es dramáticamente menor 
(Weiskrantz et al. , 1971). Blakemore et al. (1998) ampliaron el trabajo de 
Weiskrantz demostrando que al introducir una breve demora impredecible entre 
los movimientos para hacerse cosquillas a uno mismo y el suministro de una 
sensación táctil, se originaba la sensación de que te estuvieran haciendo 
cosquillas. 


La Fig. 17.1 muestra el sistema de control motor propuesto por Frith et al. Supón 
que estás haciendo una tortilla y quieres coger un huevo. Tu objetivo sería 
romper el huevo. Supón por tanto que el estado deseado de la acción te llevara a 
agarrar el huevo y romperlo sobre el filo del plato. Los controladores del 
movimiento organizarían una cadena de subacciones que integrarían tu 
percepción del huevo y su localización, con movimientos de alcance y de agarre. 
Estos a su vez implicarían órdenes motoras que darían lugar al movimiento que 
tendría en cuenta el estado actual y la posición de tu brazo y de tu mano, y eso 
estaría acompañado por las sensaciones de retroalimentación en ese momento. 
Esto a Su vez se usaría para estimar el estado esperado, según el rendimiento de 
esa acción. Los controladores estarían influidos por una serie de affordances, 
incluyendo la forma del huevo, su peso y su fragilidad probables. La 
consecución exitosa del objetivo estaría monitorizada en tres puntos, marcados 
por una cruz en la Fig. 17.1. Uno de ellos realiza una equiparación entre el 
estado deseado y el estado estimado actual, que a su vez es derivado 
indirectamente de la cadena de órdenes motoras combinadas con la 


retroalimentación sensorial. Cuando el brazo se estira y la mano se acopla a la 
forma del huevo, la discrepancia entre el estado actual y el deseado se reducirá 
hasta el punto en que se alcance el objetivo. 
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Fig. 17.1. Los componentes básicos de un sistema de control motor basados en 
los principios de ingeniería que constituyen la base de la interpretación del 
control de acción propuesta por Frith et al. (2000). Basado en Frith et al., 
«Anormalidades en la conciencia y control de la acción». En: Transacciones 
filosóficas de la Royal Society en Londres B 355, 1773. Figura 1. Reproducido 
con el permiso de la Royal Society. 


Supón que el huevo está sobre una ligera pendiente y empieza a deslizarse 
alejándose de ti. La posición predicha de tu mano no coincidirá ya con el estado 
deseado, y esta contradicción te llevará a ajustar los controladores, estirando más 
el brazo, lo que a su vez modificará los predictores hasta un punto en que 
desaparezca la discrepancia entre el estado deseado y el predicho. 


Frith et al. incluyen explícitamente un tercer punto de comparación para dar 
cuenta de la forma en que la práctica mental puede mejorar el rendimiento. 
Imagina que estás practicando tiros a canasta. "Tu posición imaginada y el estado 
deseado, meter la pelota en la canasta, se unirían activando implícitamente los 
controles motores necesarios, y después comprobando la predicción de este flujo 
con la que esperaríamos en base a nuestra experiencia previa de 
retroalimentación sensorial. Aunque puede que esto no sea la manera más rápida 
de mejorar una habilidad, ya que una adecuada predicción depende por supuesto 
de una gran experiencia previa, sí existen claras pruebas de que esto funcione 
realmente (Feltz y Landers, 1983). Dada esta dependencia de la experiencia 
previa dentro del modelo, Frith et al. no predecirían presumiblemente un efecto 
de la práctica mental para el caso de habilidades nuevas. 


17.2.3. Trastornos de la percepción y de la acción 


17.2.3.1. Apraxia 


Frith et al. ilustran el funcionamiento del modelo en términos de una serie de 
anormalidades perceptivas y del control de la acción. El término ataxia óptica, 
algunas veces denominado como síndrome de Balint, se refiere a un grupo de 
pacientes con dificultades para agarrar objetos, a pesar de que los ven de forma 
perfectamente clara. Los pacientes realizan el movimiento adecuado, pero lo 
ejecutan torpemente. Por ejemplo, no abren la mano a tiempo para coger el 
objeto, o puede que la coloquen en una orientación o localización inapropiadas 
(Jeannerod et al. , 1994). Frith et al. atribuyen esto a un fallo en la utilización del 
contexto para adecuar el movimiento correcto, es decir, un fallo en el nivel de las 
affordances dentro de su modelo. Curiosamente, algunas veces los pacientes 
pueden usar el conocimiento previo de un objeto para sustituir la información 
perceptiva inmediata. Por ejemplo, un paciente podría coger un pintalabios pero 
no un cilindro de las mismas dimensiones (Jeannerod et al. , 1994). El 
almacenamiento temporal también puede ser útil en esta conexión. Un estudio de 
Milner et al. (1999) contrasta dos casos. El paciente D. F. puede asir objetos, 
pero no los reconoce. Sin embargo, una breve demora que le obligue a confiar en 
su memoria suprime completamente su habilidad para asir objetos. El patrón 
exactamente contrario se daba con un paciente con ataxia óptica, cuya Capacidad 
para asir un objeto mejoraba tras una demora breve. La información en memoria 
era presumiblemente más precisa que la información sensorial defectuosa. 


De hecho existen muchos tipos de apraxia en los que la capacidad para iniciar 
y/o controlar el movimiento voluntario está deteriorada. Los distintos tipos de 
apraxia varían desde dificultades para la articulación vocal, donde los pacientes 
afásicos son incapaces de producir sonidos en el orden correcto, hasta la apraxia 
para vestirse, donde los pacientes no parecen ser capaces de «recordar» cómo 
ponerse un par de pantalones o una camiseta. También puede depender de la 
naturaleza del indicio, por lo que algunos pacientes pueden obedecer a la 
instrucción «péinate el pelo», pero no pueden imitar esa acción (De Renzi, 1982; 
Shallice, 1988). 


Frith et al. comparan el caso de la ataxia óptica, en el que las affordances que 
ofrece el ambiente no se utilizan adecuadamente, con el caso de la mano 
anárquica, por el cual el miembro travieso realiza actos que son inconsistentes 
con los objetivos del paciente, pero que están sintonizados de forma precisa y 
apropiada con las affordances de la situación estimular. Ambas manos son 
sensibles al input del medio, y son capaces de responder a las affordances 
relevantes, pero los pacientes con ataxia óptica fracasan porque no pueden usar 
la información visual para guiar la acción apropiadamente, mientras que los 


pacientes con mano anárquica se sienten desconectados de la actividad de su 
mano, debido a una falta de control de arriba hacia abajo. 


17.2.3.2. El papel del Área Motora Suplementaria 


Como Della Sala et al. (1994) apuntaron, los pacientes que muestran los 
síntomas de la mano anárquica tienen típicamente un daño unilateral en el ASM, 
un área de control motor de nivel superior relacionada con la coordinación entre 
distintos movimientos. En contraste, el daño en casos de apraxia es típico del 
lóbulo parietal, un área implicada en la habilidad para realizar movimientos 
precisos individuales para asir y alcanzar objetos (Passingham, 1998). Mushiake 
et al. (1991) entrenaron a unos monos para que presionaran una secuencia de 
botones en respuesta a unas luces, o bien que repitieran de memoria la misma 
secuencia de movimientos. La respuesta guiada externamente activó 
predominantemente la corteza motora primaria, mientras que el movimiento 
recordado se asoció más fuertemente con la activación del AMS. 


17.2.3.3. Manos anárquicas y miembros fantasmas 


Debe recordarse que la mano anárquica se asocia a menudo con un daño en el 
AMS. Este síntoma podría interpretarse como un fallo del estado de la meta 
deseada para controlar el movimiento de la mano y del brazo, gobernados por la 
zona lesionada del AMS, mientras que siguen siendo capaces de controlar la otra 
mano. Se supone que la conducta de utilización es resultado de una mayor 
ausencia del control inhibitorio, lo que permite que el sistema sea guiado por las 
affordances en mayor medida de lo que sería considerado normal. Un ejemplo 
análogo en personas normales lo proporcionan los lapsus de acción, que tienden 
a ocurrir cuando estamos distraídos, y por tanto no aplicamos sobre el sistema un 
fuerte control inhibitorio en dirección a la meta. Bajo estas circunstancias, las 
affordances habituales fuertemente basadas invalidarían las metas actuales para 
producir una acción errónea no deseada. 


Frith et al. interpretan el fenómeno del miembro fantasma asumiendo que la 
plasticidad neural da lugar a una reorganización de la corteza cerebral, de forma 
que el área que previamente se encargaba del miembro ausente es tomada por 
otra parte del cuerpo mediante retroalimentación somatosensorial. Los pacientes 
sienten a veces que pueden mover su miembro porque siguen siendo sensibles a 
la eferencia de las órdenes motoras, alimentándose así el estado predicho. Si 
repetidamente se observara que el miembro no se mueve, entonces esta 
asociación se extinguiría, y gradualmente desaparecería la capacidad ilusoria de 
que se puede mover. 


17.2.3.4. Anosognosia 


El caso de pacientes que experimentan miembros supernumerarios también se 
puede explicar en términos de un fallo para integrar la información de las 
órdenes motoras con la retroalimentacón sensorial, lo que da lugar a dos 
mensajes inconsistentes en relación con la localización del miembro. Al palpar el 
miembro en cuestión se obtiene una mayor información que permite que 
predomine un estado de los asuntos percibidos. 


En algunos casos el paciente podría declarar que realiza ciertos actos que son 
imposibles debido a la parálisis de uno de los miembros. Por ejemplo, un 
paciente con el brazo izquierdo paralizado puede afirmar que es capaz de 
aplaudir, haciendo movimientos de aplauso con una sola mano y afirmando que 
está realizando este acto normalmente (Ramachandran, 1996). A menudo, esto 
ocurre en combinación con la heminegligencia unilateral del espacio izquierdo, 
por la cual los pacientes son incapaces de atender a los ítems y objetos situados 
en su campo visual y/o motor izquierdo. Esto se asocia normalmente con un 
daño en el hemisferio derecho. Un rasgo importante de la anosognosia es que el 
paciente cree que puede realizar un acto, como aplaudir o subir las escaleras, a 
pesar de las claras evidencias de su incapacidad: el fracaso a la hora de percibir 
esto, o de aprender a reconocer esta incapacidad, estaría implicando procesos 
que van más allá del control motor. El hecho de que la anosognosia aparezca en 
otros trastornos como la amnesia o incluso la ceguera, también estaría 
implicando un sistema más general relacionado con la evaluación de las 
evidencias disponibles. Esta función se atribuye a menudo a la región frontal 


derecha (Owen, 1997). 


Por supuesto, el modelo de control de la acción propuesto por Frith et al. estaba 
muy ligado al estudio del control motor. Sin embargo, sugirieron que podría 
aplicarse mucho más ampliamente. Un buen ejemplo de esto es el intento de 
Frith (1989) para explicar algunas creencias extrañas, atribuciones y a veces 
acciones, que comprenden lo que se conoce como síntomas positivos de la 
esquizofrenia. 


17.2.4. Alucinaciones e ilusiones 


Casi todas las ilusiones perceptivas o motoras de la agencia y el control descritas 
hasta ahora son resultado de un daño cerebral físico o de la manipulación de la 
retroalimentación perceptiva en sujetos normales. Sin embargo, es importante no 
ignorar otra fuente de evidencia de los trastornos de percepción de la agencia, 
aquellos encontrados en las alucinaciones e ilusiones que constituyen uno de los 
síntomas positivos más sorprendentes asociados con la esquizofrenia. 


Los síntomas de la esquizofrenia se dividen normalmente en dos categorías: 
positivos y negativos. Los síntomas positivos incluyen distorsiones de la 
conducta y de la experiencia, como los delirios de persecución y de grandeza, las 
alucinaciones de naturaleza visual o auditiva, los sentimientos de 
despersonalización e ilusiones de agencia, por las cuales el paciente cree que 
está siendo controlado por fuerzas externas. Entre los síntomas negativos se 
incluye la depresión y un procesamiento cognitivo deteriorado que se puede 
extender a la atención y que frecuentemente también incluye una memoria 
episódica deteriorada (Frith, 1992; McKenna et al. , 2002). 


17.2.4.1. Alucinaciones auditivas 


A menudo, los pacientes esquizofrénicos parecen experimentar voces «en su 
cabeza». Las voces suelen hacer reproches al paciente, y pueden formar parte de 


una ilusión más amplia. Un paciente descrito por Baddeley et al. (1996), por 
ejemplo, creía que su cerebro y varios órganos internos estaban siendo sustraídos 
por «ángeles». Cuando se le preguntó por qué pensaba eso, él aludió a dolores de 
cabeza y del cuerpo, y cuando se le presionó más y se le preguntó que por qué no 
atribuía el dolor a un simple dolor de cabeza, dijo que porque los ángeles se lo 
habían dicho. También tenía un ángel bueno con el que hablaba con un acento 
algo distinto (BBC Inglesa). 


Hay evidencias que sugieren que las alucinaciones auditivas se incrementan si se 
presenta un ruido fluctuante desestructurado, y que se reducen presentando 
estímulos más estructurados, como el habla o la música, o pidiendo al paciente 
que lea en alto (Margo et al. , 1981). Se están acumulando evidencias que 
sugieren que, en realidad, los pacientes generan voces ellos mismos, 
subvocalmente, es decir, a través del bucle fonológico. El ruido aleatorio 
proporciona un input que se puede interpretar como lenguaje, mientras que la 
música estructuralmente coherente, el habla y la supresión articulatoria, parecen 
interrumpir el ciclo de generación subvocal y prevenir las alucinaciones 
auditivas (McGuire et al. , 1993). 


17.2.4.2. Transmisión del pensamiento 


La transmisión del pensamiento, por la cual el paciente cree que está siendo 
controlado por los deseos de los demás, interfiere con el recuerdo verbal 
inmediato, tal como se esperaría si estuviera implicada la activación implícita del 
bucle fonológico (David y Lucas, 1994). Los estudios de neuroimagen 
involucran al área de Broca en las alucinaciones auditivas, de nuevo de forma 
consistente con la opinión de que las alucinaciones son generadas activamente 
por el paciente (McGuire et al. , 1993). Para resumir, las alucinaciones auditivas 
implican una experiencia auditiva cuasiverbal que parece estar autogenerada 
pero que se percibe como externa, y a menudo se interpreta como si reflejara un 
agente externo que intenta controlar al paciente. Frith (1992) las considera como 
parte de una categoría más general de ilusiones de control que reflejan un 
trastorno de automonitorización. 


17.2.4.3. Mlusiones de control 


Son de dos tipos. El primero consiste en que el paciente cree erróneamente que 
él está influyendo en los sucesos externos. Un ejemplo ocurrió en un paciente 
que vivía en Yorkshire, Inglaterra, que estaba convencido de que sus 
pensamientos influían en la conducta de un montón de gente en Australia. El 
segundo tipo es más común, en este caso los pacientes creen que están siendo 
controlados por otros. Esto puede asociarse con un sentimiento general de 
pasividad, como en el caso del paciente que comentó, «mis dedos cogen el 
bolígrafo pero yo no les controlo. Lo que hacen no tiene nada que ver conmigo» 
(Frith, 1992). La fuente de control externo puede ser identificada con un 
individuo concreto. «Los pensamientos de Eamon Andrews (una personalidad de 
la T.V.) me vienen a la mente. Trata mi mente como una pantalla y proyecta sus 
pensamientos sobre ella» (Frith, 1992). A veces, esta inserción del pensamiento 
puede ser mucho más seria, como cuando las sugestiones potencialmente 
dañinas parecen estar elaboradas por una figura poderosa, como Dios o el diablo. 


Frith (1992; Frith et al. , 2000) proporciona una explicación de las alucinaciones 
auditivas y de las ilusiones de agencia como parte de su teoría general sobre el 
control de la acción. Él sugiere que estas representan un fallo de 
automonitorización, en donde las alucinaciones auditivas representan los 
procesos de pensamiento del paciente que a menudo están perturbados. Esto 
conlleva una verbalización subvocal que no se reconoce como autogenerada 
porque el proceso de retroalimentación apropiado está defectuoso. Los pacientes 
crean un mundo ilusorio en un intento de dar explicación a estas experiencias 
extrañas. En el caso de las alucinaciones auditivas, son típicamente atribuidas, o 
bien a seres sobrenaturales como ángeles diabólicos o el diablo, o bien a 
poderosas agencias del gobierno. Normalmente los pacientes creen que su mente 
está siendo controlada por medios tecnológicos avanzados, donde a menudo se 
cree que el controlador es la policía o bien el estado. En contraste con las 
confabulaciones de pacientes con daño en el lóbulo frontal (Baddeley y Wilson, 
1986), las ilusiones parecen ser por lo general estables y consistentes, y los 
pacientes con estas ilusiones no parecen ser más proclives a mostrar evidencias 
de un déficit ejecutivo general que los pacientes que no poseen estas ilusiones 
(Baddeley et al. , 1996). 


Frith sugiere que el contenido personal y social de las alucinaciones y de las 


ilusiones de control refleja el funcionamiento de un componente neural común, 
el cual también se asocia con una capacidad para intuir lo que otras personas 
están pensando, a lo que algunas veces nos referimos como «teoría de la mente» 
(U. Frith, 1989). Esta facultad subyace a la capacidad para ponerse en el lugar de 
otra persona, teniendo en cuenta, por ejemplo, lo que hacen y lo que no saben, 
para poder predecir su conducta. Es una capacidad que está particularmente 
deteriorada en el autismo, y que puede verse comprometida incluso con un nivel 
de funcionamiento intelectual alto (U. Frith, 1989). 


Frith propone que el mecanismo de la teoría de la mente permite una estrategia 
de modelización hacia delante, por la cual podemos anticipar la conducta de los 
demás. Los estudios de neuroimagen sugieren que la lectura de fragmentos que 
suponen una gran demanda en cuanto a la necesidad de ponerse en el lugar de 
otros para comprenderles, implican una activación en el área media y frontal, 
áreas que también están activamente implicadas en las alucinaciones y en las 
ilusiones en pacientes esquizofrénicos (Frith, 1992; Silberzweig et al. , 1995). 


17.3. Implicaciones del control motor para la memoria de trabajo 


Asumiendo que las alucinaciones, las ilusiones y las demostraciones de las 
ilusiones del control motor son intrínsecamente interesantes, y que la 
modificación que hacen Frith et al. del modelo de Wolpert supone un comienzo 
prometedor para intentar comprender esta confusa serie de fenómenos extraños, 
¿por qué son relevantes para la memoria de trabajo? Para responder a esto, 
deberíamos retomar la revisión que hacen Bargh y Ferguson (2000) respecto a la 
medida en que la conducta social está ampliamente controlada por procesos 
automáticos, y su hipótesis de que no existe razón alguna para asumir que las 
acciones mediadas conscientemente son controladas de una forma distinta. 


Habiendo demostrado que los objetivos pueden ser inducidos implícitamente, 
Bargh y Ferguson rechazan la distinción entre los procesos automáticos y los 
controlados sobre la base de que «estos procesos control son en sí mismos 
controlados por estructuras de objetivos que funcionan automáticamente y con 
determinación» (Bargh y Ferguson, 2000, p. 939). Sugieren también que en un 
experimento psicológico estándar, «la situación experimental requiere que los 


participantes deleguen en el experimentador, que controla lo que hacen» (Bargh 
y Ferguson, 2000, p. 393), concluyendo que el control aún sigue siendo externo. 
Incluso cuando el sujeto realiza acciones concretas y hace planes para el futuro, 
sugieren que su conducta se puede definir como «delegar el control al 
ambiente», y la conducta nueva y la no-habitual es representada 
automáticamente y no conscientemente cuando aparece el indicio del suceso 
ambiental designado (Gollwitzer, 1993, p. 174). Bargh y Ferguson no niegan la 
posible complejidad de los mecanismos subyacentes, pero enfatizan los procesos 
implícitos y un control estimular externo como representantes de toda la 
conducta, su revisión refuerza una visión simplista del bucle estimular del 
control de la acción, un enfoque que se ve acentuado por el énfasis que ponen en 
la automaticidad y en el frecuente uso del término control y del término 
determinismo. 


Yo sugeriría que la riqueza y la complejidad de los conceptos y mecanismos 
necesarios para explicar la sencilla conducta de alcance y agarre estaría 
recalcando la importancia que tiene no sucumbir a la tentación de poner 
demasiado énfasis en los procesos puramente automáticos. Por tanto, ¿qué 
lecciones deberíamos aprender de la conducta motora que podría aplicarse 
útilmente al control ejecutivo de una conducta más general? 


1. Complejidad. La variedad de trastornos e ilusiones descritas pone de 
manifiesto que el sistema implicado es altamente complejo y capaz de fallar en 
muchos puntos, desde el movimiento depurado en la ataxia óptica, hasta un fallo 
para reconocer el grave déficit motor presente en la anosognosia. 


2. El control es Multinivel. El rendimiento puede disminuir en cualquiera de los 
distintos niveles, desde un fallo en la correcta sintonización de los receptores en 
la ataxia, pasando por trastornos perceptivos en los que los pacientes pueden 
creer que tienen un miembro adicional, hasta la ceguera cortical, en la que, a 
pesar de la información que posee la mano para adoptar una forma apropiada, 
esta información no se puede usar para planificar la conducta porque no está 
disponible de forma consciente. 


3. Interacción entre Componentes. Bajo condiciones normales, los distintos 
componentes trabajan juntos de forma tan eficiente que la necesidad de 
coordinación rara vez es obvia. Esto se pone de manifiesto en los numerosos 


casos de agnosia, en los que, según donde se encuentre la lesión, los problemas 
pueden surgir para identificar un objeto pero no para alcanzarlo, o viceversa, 
alcanzarlo sin problemas pero fracasar al identificarlo. En otros casos los 
pacientes pueden ser capaces de imitar una acción pero no pueden realizarla 
como respuesta a una petición, mientras que otros pueden responder a estímulos 
ambientales, pero no pueden imitarlos. 


4. La Importancia de la Conciencia. Puede que este sea el punto que más se 
opone a las propuestas de Bargh y Ferguson. Como Frith et al. observan, parece 
imposible proporcionar un relato razonable de los datos sin considerar no solo la 
presencia o ausencia de la conciencia, sino también sus características. Un 
paciente con mano anárquica puede ser demasiado consciente de las travesuras 
de la mano que no puede controlar, lo que le llevará a sentir un gran bochorno. 
No es fácil explicar el control de la mano normal, ni el de la mano anárquica, sin 
asumir diferentes niveles de control con distintos accesos a la conciencia. 


5. El Sentido de Agencia no es Unitario. Los pacientes con los síntomas de la 
mano anárquica son conscientes de la acción de ambas manos, pero su sentido de 
agencia, de ser capaz de controlar lo que está pasando, está presente para una 
mano pero no para la otra, aunque ambas estarían realizando simultáneamente 
acciones coherentes, que de hecho podrían estar en conflicto directo. 


El modelo de Frith et al. todavía se encuentra en un estado de desarrollo 
temprano, pero, como ellos sugieren, proporciona una posible interpretación del 
control ejecutivo más generalmente. El modelo recoge una serie de rasgos 
importantes a partir de los datos, incluyendo su complejidad y la necesidad de 
control en una serie de niveles diferentes. El hecho de que los autores crean 
necesario hacer fuertes supuestos sobre el papel de la conciencia supone un 
importante correctivo al énfasis que normalmente se ha puesto sobre la 
automaticidad, en la mayoría de la literatura sobre psicología social. La voluntad 
de asumir que la conciencia en sí misma no necesita ser simple y unitaria es 
también un aspecto importante del modelo. El reconocimiento que hace el 
modelo de la importancia de los hábitos y de los procesos automáticos, y su 
énfasis en la importancia de los procesos inhibitorios para el control de la acción, 
son por supuesto consistentes con el modelo SAS de Norman y Shallice (1986) 
sobre el control de la acción, que ha caracterizado nuestros propios intentos de 
modelar el ejecutivo central como componente de la memoria de trabajo. 


17.4. Conclusiones 


Está claro que el control de la acción es complejo y funciona a través de una 
serie de niveles diferentes. ¿Representa esto un problema para la postura 
determinista de Bargh y Ferguson? Seguro que ellos aceptan la complejidad del 
control, que la evolución ha moldeado nuestros procesos de control de forma 
efectiva, y que el daño cerebral o las enfermedades pueden interferir con su sutil 
funcionamiento. Desde mi punto de vista, el problema crucial de su enfoque 
unitario sobre el control implícito se encuentra ejemplificado en el caso del 
paciente con mano anárquica de Della Sala. Tanto la mano derecha «buena» 
como la mano izquierda «traviesa» que roba espinas de pescado están bien 
controladas, en el sentido de que ambas pueden usar indicios ambientales para 
coger la comida de forma precisa y llevársela a la boca. Sin embargo, solo la 
mano derecha parece estar gobernada por objetivos integrados de alto nivel que 
son accesibles a la reflexión, es decir, solo esta mano parece estar bajo control 
consciente. 


Notas al pie 


* James Gibson introdujo este término en 1977 para describir la relación 
recíproca entre un animal y su ambiente: «Las affordances del medio son lo que 
este le ofrece a los animales, lo que les proporciona (...) tanto para bien como 
para mal» (J. Gibson, 1979, p. 127, traducido). Actualmente no existe una 
traducción aceptada del término, aunque una traducción literal podría ser 
«facilitaciones», sin embargo, el término significa algo más que esto. N. de la T. 


CAPÍTULO 18 


Memoria de trabajo en contexto 


La vida, el universo y todo lo demás 


Comencé este libro hace unos cinco años. Sabía que no tendría oportunidad de 
revisar con profundidad la enorme literatura que se ha acumulado desde mi libro 
de 1986, pero pretendía realizar un amplio ensayo que resumiera y justificara mi 
propia visión actual sobre la memoria de trabajo, y que la situara en un contexto 
más amplio. A medida que progresaba el libro, me di cuenta de que necesitaba 
regresar a la literatura y comprobar evidencias medio olvidadas, lo que a su vez 
me exigía una lectura más amplia, surgiéndome nuevos pensamientos sobre los 
temas, y pronto me di cuenta de que se requería un ensayo considerablemente 
más amplio. 


Para situar el concepto de memoria de trabajo en un contexto más amplio, 
comencé a leer más, viendo nuevos vínculos con campos como la psicología 
social y la clínica, y me di cuenta de que muchas de las ideas que allí se 
desarrollaban tenían poderosas reminiscencias con cuestiones clásicas dentro de 
la psicología de la mente. Comencé mi carrera con un fuerte interés en la 
filosofía; de hecho sopesé la posibilidad de realizar la licenciatura en filosofía, 
pero finalmente me decidí por la psicología, ya que pensé que sería difícil 
ganarme la vida como filósofo. Es más, en Inglaterra, la filosofía estaba siendo 
dominada por análisis lingiiísticos bajo la influencia de Wittgenstein en 
Cambridge y de Austin en Oxford, un enfoque que yo encontraba totalmente 
estéril. Por ello, comencé a considerar la filosofía, o al menos la filosofía de la 
mente, poco más que como un juego para un psicólogo de diván que jugaba con 
reglas lingúísticas más bien estériles. 


En los últimos años, me he ido dando cuenta, cada vez más, de que mi trabajo y 
el de otros en la psicología cognitiva está basado implícitamente en una serie de 
supuestos filosóficos que no obstante son influyentes para el estado inconsciente. 
En mi caso, el tema aflora más claramente con la cuestión de hasta qué punto la 


conciencia juega un papel en las imágenes visuales (Baddeley, 1993; Baddeley y 
Andrade, 1998). Como parte de mi intento de reeducarme, decidí leer un libro de 
Magee (1987), basado en una serie de entrevistas televisivas en las que 
distinguidos filósofos contemporáneos eran invitados a explicar y discutir el 
trabajo de un filósofo clásico. Reavivaron mi entusiasmo y me sorprendieron con 
una serie de temas contemporáneos de la neurociencia cognitiva que ya se 
prefiguraban en el trabajo de nuestros padres de la filosofía. También me 
sorprendió descubrir la afinidad que sentía ante ciertos enfoques, quizá sin que 
esto sorprendiera a los Asociacionistas Británicos, concretamente con el de Lock 
y Hume, y la poca afinidad que experimentaba ante otros enfoques como el de 
Hegel y Sastre. También hubo algunas sorpresas, incluyendo un agradable 
argumento a favor de la importancia del conocimiento implítico presentado por 
Heidegger. 


Pensándolo bien, no debería haberme sorprendido tanto, dado que la clásica 
filosofía de la mente se basaba presumiblemente en el razonamiento de pruebas 
basadas en la observación y la autoobservación, que son una fuente importante 
de mis propias ideas, y supongo que también de muchos de mis colegas. La 
diferencia, por supuesto, es que ahora tenemos una serie de técnicas objetivas 
mucho más amplias que permiten poner a prueba nuestras intuiciones 
empíricamente, junto con un juego de herramientas conceptuales mucho más 
ricas y complejas para su desarrollo teórico. En este último capítulo, por tanto, 
me gustaría satisfacer mi antiguo interés sobre cuestiones filosóficas, 
especulando acerca del lugar de la memoria de trabajo desde un punto de vista 
evolucionista y discutir brevemente ciertos puntos en los que la filosofía de la 
mente interactúa con el estudio empírico de la memoria de trabajo. 


18.1. Una perspectiva evolucionista 


Actualmente los enfoques evolucionistas de la psicología son modernos y 
controvertidos. Son modernos porque sitúan a la psicología en un contexto 
biológico más amplio, y pueden proporcionar indicios sobre cómo tratar viejos 
problemas sugiriendo las posibles ventajas o desventajas evolucionistas de una 
función concreta de la conducta. En mi propio caso, por ejemplo, la pregunta de 
un viejo amigo sobre el posible valor evolucionista del bucle fonológico me 


llevó directamente a una línea de investigación muy productiva acerca del bucle, 
como invento para la adquisición del lenguaje (ver Capítulo 2). Sigo 
encontrando fructífero este marco de trabajo evolucionista, tal como se indica en 
el capítulo sobre la depresión, aunque, por supuesto, todavía es demasiado 
pronto para saber si mi propia especulación evolucionista demostrará ser 
efectivamente más productiva que otros intentos para explicar la depresión. 


Así pues, las explicaciones evolucionistas tienden a ser controvertidas, y a 
menudo son calificadas burlonamente como «Solo historias», ya que se parecen 
a los encantadores cuentos de Rudyard Kipling sobre por qué el elefante tiene 
trompa y el leopardo puntos. En resumen, estas explicaciones son criticadas 
como puras especulaciones, que al unirse a la teoría evolucionista toman un falso 
aire de respetabilidad. Un problema de estas explicaciones es que tienden a ser 
muy difíciles de probar. Por ello, aunque me intriga la sugerencia que hacen los 
paleoantropólogos Coolridge y Wynn (2001; 2004), de que la memoria de 
trabajo que poseían los Homo Sapiens suponía una ventaja crucial sobre el 
hombre de Neandertal, veo difícil que esto se pueda probar adecuadamente. 


Sin embargo, existe un tercer uso posible para las explicaciones evolucionistas, 
que consiste en proporcionar un espacio de trabajo útil para integrar y resumir un 
campo. Este es el propósito de la próxima sección, que intenta situar a la 
memoria de trabajo en su contexto cognitivo preguntándose por la función 
biológica que desempeña dentro de un marco evolucionista más amplio. Como 
idea retórica, propongo la siguiente cuestión. Si tuvieras que diseñar un 
organismo como el Homo Sapiens, capaz de sobrevivir en un medio físico 
cambiante y complejo, ¿qué capacidades cognitivas le pedirías y por qué? Mi 
propósito no es apostar por una creación inteligente, sino darse el gusto de cierta 
manipulación inversa muy general, considerando simplemente la mente en el 
contexto de los problemas que presumiblemente se necesitaría resolver en el 
proceso de la evolución. 


Una forma de diseñar nuestro organismo sería elegir un nicho ecológico y 
manipularlo cuidadosamente para que se enfrentara a esas circunstancias. Esta 
ha sido una estrategia claramente exitosa en el caso de los tiburones, las medusas 
y muchos insectos que existen mucho antes que nosotros. Mientras que exista el 
nicho, entonces es probable que el organismo siga prosperando. Parece que los 
Homo Sapiens han desarrollado la estrategia opuesta, ya que parecen destacar 
por su flexibilidad, siendo capaces de adaptarse a una amplia serie de rápidos 
cambios ambientales usando soluciones no evolucionistas, como las ofrecidas 


por el desarrollo del lenguaje y la capacidad para crear herramientas y 
manipularlas creando aparatos complejos. Nuestra tarea consiste en considerar, 
en términos generales, qué tipo de sistema sería capaz de lograr esto. 


Si nuestro organismo fuera capaz de adaptarse flexiblemente a un mundo 
cambiante, entonces necesitaría percibir ese mundo. Claramente, esto lo 
hacemos a través de una serie de canales sensoriales como la visión, el tacto y el 
oído. Cada uno comprende otros subcanales: en el caso de la visión, por ejemplo, 
cadenas distintas de información en relación con el tipo de color, el movimiento 
y la localización. 


Como realista novato que soy, supongo que estos canales sensoriales están 
estimulados por los objetos, y que para sobrevivir en el mundo sería útil ser 
Capaz de reunir los datos procedentes de los distintos canales en representaciones 
de objetos coherentes. Como se discutió en Capítulo 8, supongo que el búfer 
episódico, como componente de la memoria de trabajo, proporciona el medio 
mediante el cual estos complejos estímulos son reunidos e integrados junto con 
el conocimiento de otras fuentes, y se hacen disponibles para la conciencia. 


Si nuestro organismo tuviera que hacer un completo uso de la información 
disponible, entonces se necesitaría algún tipo de aprendizaje. Probablemente la 
forma más simple de conseguirlo es a través de la acumulación gradual de 
evidencias, remarcando el hecho de que el mundo es un lugar ampliamente 
estable, en términos de características perceptivas básicas. Los mecanismos de 
aprendizaje implícitos proporcionan una excelente y económica base para esta 
acumulación de conocimiento, normalmente con mínima implicación de la 
memoria de trabajo (Baddeley, 1998, Capítulos 19 y 20; Schacter, 1994; Squire, 
1992). 


Sin embargo, este sistema es mucho menos efectivo al tratar con un medio 
cambiante, como cuando se viaja por una ruta que ha sido segura durante 
muchos años pero que en el último viaje hubiera sido interceptada por un fiero 
enemigo. El promediar simplemente toda la información previa disponible sería 
un desastre, mientras que la capacidad para recordar esta ocasión concreta no 
solo logrará evitar la amenaza inmediata, sino que también permitiría formular la 
hipótesis de que puede que esto solo haya sido un suceso atípico. Esta hipótesis 
se podría probar cuidadosamente y usarse el resultado en planificaciones futuras. 
Por supuesto, todo este proceso requiere memoria episódica, la capacidad para 
combinar una experiencia con su contexto temporal y físico, de situar esa 


experiencia en tiempo y lugar (Baddeley et al. , 2002b; Tulving, 1989). La 
memoria de trabajo es necesaria para codificar estas memorias episódicas, y 
aunque es menos obvio su papel en la recuperación, casi seguro que juega un 
papel en la evaluación posterior de la información recuperada (Baddeley et al. , 
1984; Craik et al. , 1996; Naveh-Benjamin et al. , 2000). 


Hasta el momento, nuestro organismo puede percibir el mundo, y aprender de él, 
y puede recordar incidentes concretos, pero no puede actuar. Esto requerirá 
obviamente un sistema motor y un método de control. Es posible que cierto 
control sea automático, como cuando los ojos siguen automáticamente un 
objetivo móvil, o cuando la respiración responde al nivel de dióxido de carbono 
presente en los pulmones. Sin embargo, si tenemos que progresar desde una 
simple reacción hasta una acción totalmente planificada, entonces necesitamos 
un mecanismo para planificar y un sistema para mantener y manipular nuestros 
planes. Planificar implica esencialmente predecir lo que pasará. Una forma obvia 
de hacer esto es simular algo que aconteció en el pasado. Esta simulación 
requiere un sistema de almacenamiento con enlaces tanto a la percepción como a 
la MLP —en resumen, una memoria de trabajo—. Si necesitamos una serie de 
planes posibles, entonces sería deseable que pudiéramos volver atrás y 
reflexionar sobre las alternativas, un proceso cimentado en el almacenamiento 
combinado y en la capacidad reflexiva de la memoria de trabajo, que funciona a 
través de la conciencia. 


Por tanto, la memoria de trabajo se sitúa en la interfaz entre la percepción y la 
acción, entre el aprendizaje y la atención, incrementando sustancialmente la 
flexibilidad del organismo. Esta explicación sugeriría usar la metáfora del 
escenario propuesta por Baars (1997), según la cual la memoria de trabajo no es 
solo el actor principal, sino todo el espectáculo. Considero que esto se aleja de la 
realidad, como espero que hayan demostrado los últimos capítulos. La capacidad 
de almacenamiento de la memoria de trabajo es pequeña y la acción mediada 
conscientemente tiende a ser lenta. Siempre que sea posible, sería sensato tener 
al organismo funcionando automáticamente, y a la limitada capacidad de 
memoria de trabajo realizando una supervisión general e interviniendo siempre 
que fallara este variado y complejo grupo de procesos automáticos, tanto por 
sobrecarga informativa como por la demanda de procesos nuevos o por 
planificación futura. 


Sugiero, por tanto, que una especie de memoria de trabajo proporcionaría una 
pieza extremadamente útil para el equipamiento multipropósito de nuestro 


hipotético organismo desarrollado biológicamente. El modelo multicomponente 
representa una propuesta de conceptualización de este equipamiento. 


18.2. Algunas implicaciones filosóficas 


18.2.1. Conciencia 


A medida que avanzaba el libro, se hacía evidente que mis ideas estaban 
penetrando en tres áreas tradicionales de la psicología de la mente: la cuestión de 
la conciencia, la naturaleza del yo y el problema del libre albedrío. El tema de la 
conciencia ya ha sido discutido en el Capítulo 16, basándome en mi enfoque de 
que la conciencia ha evolucionado como instrumento para abordar ciertos 
problemas, concretamente: (1) combinando la información procedente de los 
sentidos en representaciones integradas; (2) combinando a su vez estas 
representaciones con información de la memoria a largo plazo, y (3) sirviendo 
como espacio de trabajo global. Tanteaba esta perspectiva cuando comencé a 
leer el trabajo de Baars con más detenimiento (Baars, 1997; 2002a; b) y me topé 
con el excelente artículo de Dehaene y Naccache (2001), un trabajo que he 
empleado ampliamente en el Capítulo 13. Sin embargo, quizá sea conveniente 
retomar un punto que parece haber preocupado a ciertos científicos cognitivos 
con interés en la cuestión de la conciencia, incluyendo a mi colega en el Centro 
de Estudios Avanzados de Stanford, Jeffrey Gray (Gray, 2004). Se trata de la 
cuestión del qualia, el término filosófico para la experiencia sensorial 
fenomenológica, por ejemplo, la rojez particular de una rosa o el sabor del queso 
Stilton. 


Debo confesar que discrepo con Gray y con muchos otros en que no veo razón 
alguna para concederle al qualia un estatus especial. Mi enfoque es mucho más 
próximo al de Dehaene y Naccache: 


los contenidos de la conciencia perceptiva son complejos, dinámicos, estados 
neurales multifacéticos que no se pueden memorizar o transmitir a otros de 


forma completa. Estas propiedades biológicas parecen ser potencialmente 
capaces de corroborar las intuiciones de los filósofos sobre el «qualia» de la 
experiencia consciente, aunque se necesitará una considerable investigación 
neurocientífica antes de comprenderla profundamente. 


(Dehaene y Naccache, 2001, p. 30) 


En resumen, el qualia es simplemente un rasgo del ambiente biológico. Por 
supuesto, no todo el mundo acepta este punto de vista (Gray, 2004). 


El estudio de los aspectos fenomenológicos de la conciencia es un campo en el 
que la neuroimagen probablemente sea particularmente productiva. Si alguien 
puede identificar un patrón concreto de activación observada objetivamente que 
acompañe al relato subjetivo de una percepción concreta, y demuestra que esto 
es cierto en una serie de sujetos, entonces yo consideraría plausible sugerir que 
esos sujetos están experimentando experiencias ampliamente equivalentes. Uno 
podría entonces usar ese patrón de activación como prueba de la presencia o 
ausencia de esa experiencia en un sujeto nuevo. 


Un buen ejemplo de esto aparece en el caso de la rivalidad binocular, en la que 
un estímulo, por ejemplo, una mesa, se presenta en un ojo, y en el otro ojo se 
presenta otro estímulo, por ejemplo, un pez. Normalmente los sujetos informan 
de la oscilación entre, o ver la mesa, o ver el pez, pero no ambos. Cuando se 
pone a prueba a los sujetos humanos en estudios de neuroimagen, muestran un 
patrón de activación del lóbulo temporal inferior en el caso de una percepción 
única que es muy similar al patrón para la percepción dominante en una 
situación de rivalidad (Tong et al. , 1998). Sin embargo, cuando los sujetos 
indican un cambio, aparece una gran activación frontal adicional (Lamer et al. , 
1998). Se puede usar un paradigma similar con en el registro cerebral de monos 
despiertos que están entrenados para responder de forma diferente a cada uno de 
los patrones rivales. Mientras que las áreas de procesamiento visual de niveles 
inferiores (V1-V5) responden de forma equivalente a ambos estímulos, el lóbulo 
temporal inferior de la corteza responde de forma distinta con dos patrones de 
activación, donde cada uno se asocia a cada una de las dos experiencias 
perceptivas de las que se «obtuvo» información conductual (Leopold y 
Logothetis, 1999). 


Otro ejemplo del uso de la evidencia neurofisiológica que arroja luz sobre 
aspectos fenomenológicos tiene que ver con la distinción entre recordar y saber 
que se hace en los experimentos de reconocimiento y que está basada en 
términos fenomenológicos. Recordar está asociado con la reexperimentación 
subjetiva del suceso, acompañada típicamente de la capacidad para recolectar 
detalles asociados, a diferencia de saber que un suceso ha ocurrido, en donde no 
existe este sentimiento de «viaje mental en el tiempo» (Tulving, 1989; Gardiner, 
2001). Estudiando a Jon, un hombre joven con una amnesia atípica en la que su 
recuerdo estaba deteriorado pero el reconocimiento relativamente preservado, 
percibimos que no parecía ser capaz de usar una respuesta de «recuerdo» de 
forma correcta (Baddeley et al. , 2001c). No parecía tener acceso a la experiencia 
de recuerdo, y parecía estar usando este término simplemente para indicar su 
grado de confianza en la exactitud de su respuesta. 


Un estudio posterior de Dúzel et al. (2001), en el que se usó la técnica de 
respuestas evocadas, apoyó esta conclusión. Jon mostró una clara evidencia del 
patrón de activación típicamente asociado con una respuesta «saber» en sujetos 
normales, sin evidencias del patrón asociado a la respuesta «recordar». 
Finalmente, en un estudio con TEP de Maguire et al. (2001) se consiguió 
identificar uno o dos sucesos autobiográficos que evocaban recuerdos asociados 
característicos de una experiencia de «recordar». Estas, pero no otras memorias, 
se asociaron con el patrón de activación característico de «recordar». Sospecho 
que, a medida que sepamos más sobre los patrones de activación asociados con 
las diferentes experiencias de memoria, la neuroimagen nos proporcionará una 
herramienta cada vez más habitual para analizar los complejos procesos basados 
en la fenomenología que subyacen a la memoria humana. 


Una cuestión que surge inevitablemente siempre que uno discute los enfoques de 
la conciencia es si los animales son conscientes, y si lo son, ¿pueden serlo 
también las máquinas? Creo que el caso de los animales es relativamente 
sencillo. No considero a la conciencia como una función unitaria simple, sino 
como una solución biológica multicomponente para una serie de problemas. Es 
probable que algunos animales sean al menos conscientes en el sentido de que 
tengan una especie de sistema de combinación perceptiva, un búfer episódico en 
el que se pueda integrar y representar información sensorial. Bien puede ocurrir 
también que el sistema permita la integración de información a partir de una 
serie de sentidos diferentes; ciertamente, la enorme evidencia de que los 
animales poseen memoria episódica nos estaría sugiriendo esto, en el sentido de 
que poseen memorias integradas en relación al «qué», el «cómo» y el «cuándo» 


de un episodio, que se pueden utilizar para actuar de forma constructiva y en 
base a un propósito (ver Clayton et al. , 2002, para una discusión sobre este 
tema). Creo que es menos probable que en el reino animal prevalezca la 
capacidad de una conciencia reflexiva, aunque aceptaría el paradigma del lunar 
en la cara como evidencia prima facie de la presencia de esta capacidad en 
primates no humanos. Esta tarea consiste en poner un pequeño lunar de pegatina 
en la cara del sujeto, y después se le deja que se mire en el espejo. Muchos 
animales, incluyendo los primates, no parecen «percatarse» de que el lunar está 
en su cara, pero algunos monos sí parecen percatarse de él consistentemente, e 
inmediatamente se lo quitan (Gallup, 1970). 


¿Qué pasa con las máquinas? Aquí sospecho que ciertos aspectos definidos de la 
conciencia como la capacidad para integrar información a partir de una serie de 
fuentes distintas, para trabajar como un espacio de trabajo global, y 
posiblemente para operar de forma reflexiva, bien podrían poseerlos las 
máquinas. Sin embargo, yo tendría mis dudas de que esto constituyera una 
conciencia, ya que sospecho que la conciencia implica también otras funciones. 
Incluso si se lograran estas metas, esto no significaría necesariamente que las 
máquinas tuvieran una conciencia justo como la nuestra, ya que las funciones 
variarán de acuerdo a la forma en que fueron logradas. Puede que Kasparov y 
Big Blue sean unos jugadores de ajedrez formidables, pero la forma en que 
consiguen sus resultados es muy distinta. Pero, ¿podrían las máquinas llegar a 
ser conscientes de la forma en que normalmente entendemos este término? Dado 
que considero la mente humana como una especie de máquina, aunque de 
sutileza y complejidad enormes, sería arrogante y/o inconsistente negar la 
posibilidad de que se pudiera resolver el mismo problema biológico de forma 
similar, pero usando el hardware en el lugar del «wetware»* que ha desarrollado 
la naturaleza. 


Aunque parece improbable que esto suceda en un futuro cercano. 


18.2.2, El yo 


¿Cuál es el nexo de unión entre conciencia y acción? En el Capítulo 16, 
coincidía con Baars en que el nexo de unión lo proporcionaba el yo. Este 


concepto complejo y resbaladizo, al igual que la conciencia, fue barrido de la 
psicología cognitiva durante muchos años, antes de que la psicología social lo 
recuperara vigorosamente (Baumeister, 1998), y antes del retorno algo más 
tentativo al estudio de la cognición a través de las teorías sobre memoria 
autobiográfica (Conway, 2002), y a través de los esfuerzos de Ulrich Neisser, 
cuyo texto clásico (Neisser, 1967) jugó un papel crucial en lo que posteriormente 
se ha conocido como la revolución cognitiva. Neisser organizó una serie de 
talleres sobre los distintos aspectos del yo, incluyendo uno sobre «El yo que 
recuerda» (Neisser y Fivush, 1994). Para el presente propósito, nos limitaremos 
a discutir el papel del yo en la memoria de trabajo, centrándonos concretamente 
en el inicio y control de la acción. 


A este respecto, aceptamos la distinción que propone Damasio (2000) entre el yo 
central y el yo autobiográfico. El yo central se refleja en la conciencia central, un 
flujo multinivel de input consciente, que se autogenera perceptivamente, y que 
en el marco de trabajo de la memoria de trabajo multicomponente se identificaría 
con el búfer episódico. Como en el caso del búfer episódico, Damasio supone 
que la conciencia central depende crucialmente de una serie de fuentes distintas. 
Algunas de estas están basadas fisiológicamente, y Damasio se refiere a ellas 
como proto yo. 


El yo central es capaz de actuar y de responder de sus propios actos. Deberíamos 
pellizcarnos para asegurarnos de que verdaderamente estamos experimentando 
una situación en la que nuestros actos y preceptos están ligados. Como vimos en 
el Capítulo 17, cuando nuestros actos y la retroalimentación están disociados nos 
podemos desorientar, como en el caso de los pacientes hemipléjicos, que niegan 
poseer el brazo paralizado, o niegan la acción de una mano que no parece estar 
bajo el control consciente del paciente, como en los síntomas de la mano 
anárquica (ver Capítulo 17). 


Dentro del modelo de la memoria de trabajo, la capacidad para actuar de forma 
directa y reflexiva es probable que implique bastante más que al búfer episódico. 
Ciertamente requeriría las capacidades de control ejecutivo que posee el 
ejecutivo central, y a veces también implicaría al subsistema fonológico y 
visoespacial. Este último punto se ilustra en el caso de la inserción del 
pensamiento en la esquizofrenia, donde el paciente cree que las voces hacen 
comentarios sobre él y que le ordenan ciertas acciones, un proceso que al parecer 
está acompañado de habla subvocal y que implica al bucle fonológico, así como 
a los procesos ejecutivos (ver Capítulo 17). 


Claramente, el yo es mucho más que un sistema de control de la acción. Se 
supone que las acciones están basadas en conglomerados de hábitos complejos e 
históricamente basados, creencias y actitudes que comprenden el yo 
autobiográfico. Este sistema es estable pero está en continuo cambio y 
desarrollo, y depende fuertemente de la memoria autobiográfica. Se almacena 
implícitamente, pero, al igual que con la memoria semántica y episódica más 
generalmente, sus contenidos y sus productos están disponibles para la reflexión 
consciente. 


El yo autobiográfico no es un simple sistema unitario, sino que se puede 
considerar mejor como reflejo de múltiples yoes, una perspectiva desarrollada 
por Goffman (1959) en su concepto de los roles. Por ejemplo, Mary puede ser 
tanto madre como hija, esposa y amiga, mujer de negocios y golfista, siendo 
ligeramente distinta en cada uno de estos roles. Por supuesto, estos roles pueden 
entrar en conflicto. ¿Debería visitar a su madre enferma o asistir al partido de su 
hija en el colegio? ¿Cuando juegue al golf con su jefe debería mostrarse 
agresiva? La vida es más fácil si los distintos roles son coherentes, y tendemos a 
valorar a las personas que muestran «integridad» (aunque posiblemente no las 
elegiríamos para un alto cargo político). En su versión más extrema, una falta de 
coherencia puede producir estados patológicos, como el relato de ficción de 
Robert Louis Stevenson, el de Dr. Jekyll y Mr. Hyde. Este relato se basó en la 
historia real de Dean Brodie, un ciudadano de Edimburgo aparentemente 
respetable y eminente pero que al mismo tiempo era un asesino psicópata 
manipulador. Volveremos a la multiplicidad del yo en la próxima sección, pero 
antes de eso, creo mi deber mencionar al menos otro concepto del yo, 
concretamente el yo representado sobre la escena (Baddeley, 1994), el yo tal 
como lo perciben los demás. 


Hemos discutido el yo como un concepto puramente intrapersonal. Sin embargo, 
la analogía del teatro que incluye el concepto de Goffman sobre los roles 
implica, al menos potencialmente, una audiencia, que puede percibir o no el rol 
de la misma manera que el actor. De hecho, en el caso de los políticos, sospecho 
que consideran la apariencia como más importante que la realidad. Es más, 
nuestra propia visión de nosotros mismos no coincide con la de los demás (ver 
Capítulo 13). Sus enfoques están inevitablemente basados en una evaluación de 
nuestras acciones, incluyendo lo que decimos, una fuente de evidencia menos 
rica pero quizá más fiable que nuestras propias introspecciones interesadas. 


Sería un error sin embargo, acentuar en exceso la discrepancia entre 


autopercepción y la imagen de los demás. De hecho, para ciertos propósitos 
podemos aceptar los juicios de los demás como más válidos que los nuestros. La 
opinión de un experto acerca de un swing en el golf, por ejemplo, proporcionaría 
información crucial que no está directamente disponible para el golfista. Sin 
embargo, la percepción de nosotros mismos que tienen los demás va mucho más 
allá que esto, tal como se refleja en el caso de R.J., un paciente con un daño 
bilateral en el lóbulo frontal que le había dejado profundamente amnésico, con 
tendencia a las confabulaciones, pero encantador y divertido (Baddeley y 
Wilson, 1988). Cuando le examinamos de nuevo algunos meses más tarde había 
sufrido un pequeño golpe. Este trauma adicional le había transformado en una 
persona patética e incoherente, difícilmente capaz de enlazar dos palabras en una 
misma frase. Cuando hablamos con su mujer aquel día, nos comentó que como 
se había hecho tarde, él estaba cansado y que algunas veces, sobre todo por las 
mañanas, el viejo R.J. reaparecía. Era como si la cantidad relativamente pequeña 
de daño cerebral adicional le hubiera llevado a una condición en la que no fuera 
capaz de sostener los múltiples componentes que conformaban su persona. En 
los cortos períodos en los que tenía energía suficiente para mantener los 
componentes juntos, entonces su yo representado resurgía y se volvía 
reconocible (Baddeley, 1994). 


¿Había perdido R.J. su memoria autobiográfica? Sugiero que no; su daño 
cerebral inicial deterioró severamente su memoria autobiográfica, sin que 
aparentemente modificara su personalidad tal como aseguró su mujer. Es más, 
uno de los mayores problemas del daño cerebral no es la amnesia retrógrada que 
conlleva, sino el sentimiento de que el paciente ha cambiado, y que «no es la 
persona con la que me casé». Típicamente esto es lo que siente el cónyuge, no el 
paciente, lo que sugiere un cambio en el yo representado, y no en el yo 
autobiográfico. La validez de los autoinformes nos lleva directamente por 
supuesto al estudio de la personalidad, un tema que va más allá de nuestros 
propósitos. 


18.2.3. Acción y libre albedrío 


Entonces, ¿con una conciencia y un yo multinivel, cómo se convierte esto en 
acción? Propongo que la respuesta está implícita en la mayoría de los casos que 


he escrito. En línea con la distinción hecha inicialmente por Norman y Shallice 
(1986), sugiero que una gran cantidad de la actividad está controlada 
automáticamente sobre la base de indicios ambientales, hábitos existentes y 
esquemas, apoyados cuando se necesite por procesos automáticos de resolución 
de conflictos. Sin embargo, aunque la presencia de un indicio ambiental y de un 
hábito explicaría por qué hacemos una cosa en lugar de otra, ¿por qué hacemos 
cualquier cosa? De nuevo creo que está claro que necesitamos reintroducir 
conceptos de energía y de motivación en la psicología cognitiva. 


Sin embargo, incluso si aceptáramos una teoría de la motivación rudimentaria, 
esto todavía nos dejaría con la cuestión acerca de cómo funcionan los 
mecanismos de decisión no habituales, el ejecutivo central y el sistema 
atencional supervisor. El hecho de que funcionen está ampliamente ilustrado en 
el Capítulo 17, donde queda claro que incluso el simple acto de alcanzar y 
agarrar un objeto puede estar controlado por una serie de niveles diferentes y 
posiblemente compatibles, que dan lugar a indicios visuales ilusorios que son 
anulados por el sistema motor, y en el caso de los síntomas de la mano 
anárquica, la acción de la mano controlada conscientemente es anulada por la 
intervención inconsciente de la otra mano. 


El hecho de que una acción aparentemente simple sea controlada a distintos 
niveles está bien ilustrado en el acto de respirar. Claramente el hecho de respirar 
es una acción a nivel inconsciente, si no nos moriríamos de asfixia al irnos a 
dormir. Un nivel de control se ejercita automáticamente a través del nivel de 
dióxido de carbono presente en los pulmones, pero esto se puede anular, por 
ejemplo, cuando hacemos esnórquel, donde es importante resistir la tentación de 
respirar bajo el agua, o de hecho después de subir a la superficie, hasta que el 
agua se haya expulsado del esnórquel. Como apuntó Hughlings Jackson, 
neurólogo del siglo diecinueve, parece haber una jerarquía de sistemas de 
control, en el que los sistemas más básicos y automáticos son potencialmente 
anulados por un sistema superior (Kennard y Swash, 1989). Por supuesto, esto 
tiene un límite; al parecer no somos capaces de suicidarnos aguantando la 
respiración hasta quedarnos inconscientes, entonces el control automático de la 
respiración se reactiva. Dado que una acción tan aparentemente simple como 
respirar se controla desde múltiples niveles, no deberíamos cometer el error de 
esperar que las elecciones suficientemente complejas como para requerir del 
SAS reflejen el funcionamiento de una simple cadena causal. 


Como describí en el Capítulo 15, me alegra haber conseguido la línea propuesta 


inicialmente por Hume (1978), explorada en profundidad por Lewin (1951) y 
reintroducida por Damasio (1994); esta línea propone concretamente que el 
mundo se compone de valencias positivas y negativas, y que la acción implica 
dirigir nuestro camino a través de estas valencias de forma que maximicemos las 
consecuencias positivas y minicemos las negativas. Por supuesto, esto suscita la 
cuestión en torno a la escala de tiempo sobre la cual se promedian las valencias. 
Comer chocolate me puede proporcionar un placer inmediato, pero también me 
puede producir un sentimiento de culpa a largo plazo, al creer que debería 
recortar la ingesta de chocolate para prevenir mi salud a largo plazo. ¿Cómo 
decido si comerme o no el trozo de chocolate? Presumiblemente, poseo algunos 
métodos para decidirme entre incentivos en conflicto, si no, permanecería 
encerrado en una inactividad hasta que, igual que el burro de Buridan*, me 
muriera de hambre por estar situado entre dos haces de paja. Sospecho que en 
esta ocasión un algoritmo de resolución relativamente básico surtiría efecto, y 
mientras que estuviera sumergido en la contemplación me habría comido el 
chocolate. 


Supón que ahora consideramos el caso tristemente tópico de un terrorista suicida 
cuya acción, concretamente la de suicidarse, podría parecer irracional. No lo es 
en absoluto si él cree que su acción le va a llevar al paraíso, y está preparado 
para tolerar el odio de matar una gran cantidad de personas inocentes para 
conseguir su objetivo. Al igual que muchas de nuestras metas a largo plazo, estas 
se basan en creencias socialmente adquiridas, que sin duda son reforzadas si 
además formas parte de un grupo firmemente conformado que comparte tu 
mismo sistema de creencias. 


Un acto basado en la promesa del paraíso es, por supuesto, difícilmente altruista. 
Sin embargo, existen situaciones en las que la conducta parece ser altruista, en el 
sentido de que no lleva a un beneficio inmediato o a largo plazo del individuo, e 
incluso quizá lleva a su aniquilación. Los progenitores defienden a sus crías 
hasta la muerte en muchas especies de animales, incluyendo la nuestra, supongo. 
Es más, no hay motivo para sospechar que creer en otra vida debería ser un 
prerrequisito para todo soldado que arriesga su vida en la batalla, o en un área de 
peligro menos agresiva como la desactivación de bombas o la evacuación de un 
campo de minas. Estos ejemplos sugieren que las creencias y las construcciones 
sociales, correctas o incorrectas, pueden ser un determinante de la conducta 
enormemente poderoso. Al sugerir que las personas poseen libre albedrío, 
propongo que sus acciones están potencialmente determinadas por el balance de 
las creencias, necesidades, actitudes y hábitos que comprenden su identidad 


personal, el yo. El hecho de que alguien haya sido inducido a aceptar creencias 
profundamente antisociales no significa, por supuesto, que le falte libertad de 
actuación. 


El concepto de libre albedrío supone la capacidad de controlar las acciones de 
uno mismo. ¿Qué pasa cuando el control está comprometido de alguna manera? 
Tomemos el ejemplo ocurrido recientemente del conductor de un camión que 
conducía por la carretera una mañana. Hacía mal tiempo y había dormido poco. 
Su vehículo se salió de la carretera justo cuando la calle concurría con una vía de 
tren. Se estrelló contra el borde de la vía que justo en ese momento estaba siendo 
atravesada por un tren cargado de pasajeros, originando múltiples muertes. ¿Fue 
culpable? Un jurado dictaminó que sí, ya que había estado conduciendo en 
circunstancias inapropiadas, alegando que se había quedado dormido, y que lo 
había hecho en condiciones particularmente peligrosas. Sin embargo, su nivel de 
responsabilidad es muy distinto del que hubiera tenido si hubiera realizado un 
acto como ese intencionadamente, un hecho que presumiblemente se reflejó en 
la sentencia. 


¿Qué pasa si la persona está «mentalmente perturbada»?, un término utilizado en 
Inglaterra en tiempos en los que se colgaba a los acusados por asesinato en 
primer grado, siempre que el prisionero fuera considerado «responsable de sus 
actos». ¿Tiene un cruel asesino voluntad propia? Supón que piensa que su 
víctima es el diablo encarnado, y que está realizando un acto honorable al liberar 
al mundo de este demonio. En este caso, yo diría que el asesinato se comete 
libremente, pero bajo la dirección de una serie de creencias personales altamente 
disfuncionales y peligrosas, que ciertamente y de forma obvia requieren una 
actuación por parte de la sociedad. Lo que pase después reflejará las creencias 
que caracterizan los juicios de aprobación de la sociedad, su obligación de 
proteger a sus ciudadanos, junto con la tendencia de la sociedad a categorizar a 
las personas como buenas o malas, y a demandar retribuciones. 


¿Qué tiene que ver esto con la memoria de trabajo? Sugiero que en todo nuestro 
sistema legal está implícito el tema de cómo y por qué ocurren determinadas 
acciones, y que conceptos como «impulso irresistible» y «mentalmente 
perturbado» simplemente resaltan este hecho. Una buena teoría que explique el 
papel que representa la memoria de trabajo en el pensamiento y en la acción no 
resolverá nuestros problemas éticos, pero sí ayudará a clarificar nuestro 
pensamiento. 


18.2.4. Tres deseos 


Como psicólogo experimental, empírico-pragmático, resulta extraño terminar 
este libro con especulaciones filosóficas de amateur. Habiendo llegado más allá 
de las simples fábulas y mitos hasta la contemplación de la Vida, el Universo y 
Todo lo demás (Adams, 1979), ¿qué viene a continuación? ¿Qué tal si 
continuamos con los tres deseos, el elemento básico en todo cuento tradicional? 
¿Cuáles serían mis tres deseos para el futuro de la memoria de trabajo? Serían 
los siguientes: el primero es una súplica algo modesta; el segundo, una 
improbable petición de equipamiento, y el tercero, más grandioso, aunque quizá 
más fácil de conseguir. 


18.2.5. Estrategia 


Las personas somos enormemente flexibles, y cuando nos enfrentamos con 
problemas nuevos difíciles, como en el típico experimento psicológico, 
buscaremos una serie de soluciones. Dentro de la psicología cognitiva, nos 
enfrentamos a este problema, generando sistemáticamente y poniendo a prueba 
una serie de posibles maneras en las que el sujeto habría proporcionado el 
resultado observado sin una confianza en el sistema o en los procesos asumidos 
por la teoría. Los estudios que usan nuevas y apasionantes técnicas de 
neuroimagen para estudiar la cognición son actualmente demasiado caros como 
para exigir una serie de estudios. Por ello, desearía que intentáramos eliminar 
estas estrategias alternativas antes de llevar a cabo los estudios cruciales, en vez 
de confiar simplemente en técnicas que otros han usado y atribuido a esta 
función. 


Ante la falta de medios para realizar experimentos de neuroimagen múltiples, es 
esencial desarrollar mejores medidas rutinarias sobre el tipo de estrategias que 
usa un sujeto. Por ejemplo, no debería ser muy difícil decidir si el bucle 
fonológico se está usando en una tarea o no. ¿Podríamos entonces explorar la 
cuestión básica de cómo usar la neuroimagen para detectar estrategias? 


18.2.6. Neuroimagen barata 


La neuroimagen proporciona una herramienta de valor incalculable para 
comprender la cognición humana, una herramienta que se va refinando 
continuamente. Sin embargo, desafortunadamente, es una herramienta cara, que 
conlleva dos problemas. El primero ya se ha mencionado antes, es decir, que es 
demasiado cara como para producir estudios herméticos. Estoy seguro de que 
con el rápido avance de la tecnología aparecerán nuevos métodos de 
neuroimagen. Sin embargo, por desgracia, existen presiones institucionales para 
obtener subvenciones mayores, como consecuencia se nos acaba recompensando 
por hacer investigaciones cada vez más caras, para formar parte de «la gran 
ciencia». Lograr métodos cada vez más sofisticados e informativos es crucial 
para el desarrollo de la neuroimgaen. Sin embargo, igualmente importante es el 
uso de métodos de bajo coste que se puedan usar rutinariamente para 
incrementar la fiabilidad y validez de las metodologías existentes. Por tanto, ¿se 
podría conseguir una técnica de neuroimagen simple pero fuerte y barata? 


18.2.7. Motivación 


Como habrá quedado claro ya, creo que el desarrollo de la psicología cognitiva 
como una disciplina de procesamiento de la información ha sido enormemente 
productivo. En comparación, los otros dos dominios de la psicología, el oréctico 
y el conativo, el estudio de las emociones y de la voluntad, han sido ignorados, 
como se discutió en los Capítulos 14 y 15. Si el objetivo es avanzar, es 
claramente importante ir más allá de la cognición e intentar comprender no solo 
cómo se controla la conducta, sino por qué. 


¿Por qué hacemos cualquier cosa? Necesitamos una teoría de energía mental y 
física, que incluya una comprensión de las diferencias individuales que aparecen. 
¿Por qué algunas personas tienen mucha más energía que otras? Finalmente, 
necesitamos entender su patología, incluyendo los determinantes físicos y 
psicológicos de los fallos, y cómo se les puede dar la vuelta. 


18.3. Epílogo 


¿Cuál es la unión entre estas ligeras especulaciones sobre la vida, el universo y 
todo lo demás, y nuestro punto de partida, el estudio bastante más mundano 
acerca del papel de la semejanza fonológica en el recuerdo de cadenas de 
consonantes? La respuesta a un solo nivel la obtuve tras un año inhalando los 
intensos vapores de la Bahía de California, donde el Centro de Estudios 
Avanzados me proporcionó colegas estimulantes, así como tiempo para pensar, 
aunque no para terminar de escribir. Al final de mi viaje de cinco años al menos 
estoy convencido de que existe una unión entre los experimentos descritos y las 
conclusiones especulativas. Las introspecciones y los descubrimientos hechos 
durante mi estancia allí se volvieron considerablemente menos originales de lo 
que parecía en un principio. Por ejemplo, al menos dos de mis colegas del 
Centro de Estudios Avanzados, parecieron sostener ideas ampliamente similares. 
Sospecho que todos hemos sido arrastrados por el mismo zeitgeist*, 
concluyendo que una serie de cuestiones, previamente limitadas al dominio de la 
filosofía, se han resuelto, y lo que es más, son tratadas actualmente con cierto 
éxito por la psicología cognitiva y la neurociencia cognitiva. 


Me satisface decir que sigo estando convencido de que el concepto de memoria 
de trabajo está jugando un papel muy útil en este desarrollo. Por supuesto, mi 
particular enfoque multicomponente de la memoria de trabajo no es de ningún 
modo el único disponible. Sin embargo, tiene una serie de ventajas. El modelo 
básico es simple, fácil de comprender y está acompañado de una serie de 
técnicas experimentales bien probadas que han demostrado ser aplicables a una 
amplia serie de campos, tanto básicos como aplicados. Es una teoría que ha 
permanecido cerca de los datos. Esto tiene la desventaja de que la hace menos 
excitante teóricamente que otras especulaciones más osadas, pero ha permitido 
que se desarrollara orgánicamente de una forma que permanece altamente 
productiva después de 30 años de desarrollo empírico y teórico. 


El modelo multicomponente lo han criticado jóvenes colegas míos por su falta 
de predicciones claras (Andrade, 2001), y otros por su confianza en la reificación 
simplista de temas complejos (Macken y Jones, 2003; Parkin, 1998). Me alegra 
aceptar estas críticas como coste inevitable del estilo teórico que he adoptado. 


Un rasgo importante de los conceptos comparables a una especie de mini 
hombrecitos, tales como el ejecutivo central y el búfer episódico, es que 
engloban cuestiones importantes dentro de un marco de trabajo conceptual 
relativamente simple. El éxito de estos conceptos depende en última instancia de 
su Capacidad para estimular la investigación empírica y para organizar los datos 
resultantes. 


Cuando los problemas sean tan difíciles como a los que se enfrentan los 
psicólogos cognitivos, creo que deberíamos estar preparados para aceptar un 
progreso constante, si bien poco espectacular, y al mismo tiempo estar alerta ante 
la posibilidad de que se desarrollen nuevas técnicas que nos permitan tratar 
problemas que previamente fueron intratables. La psicología cognitiva se ha 
beneficiado de una serie de desarrollos durante mi propia carrera investigadora; 
el más importante de todos es la adopción de la metáfora del ordenador que 
subyace a la tan nombrada revolución cognitiva (Broadbent, 1958; Craik, 1943; 
1948; Neisser, 1967). A estos le han seguido una serie de avances conceptuales 
excitantes, aunque el grado de revuelo suscitado no siempre predice la magnitud 
de la contribución. 


La gramática transformacional (Chomsky, 1957), la modelización matemática, la 
Inteligencia Artificial y la aplicación del conexionismo y de los modelos de 
procesamiento de distribución en paralelo han contribuido todos, y siguen 
haciéndolo, a nuestra comprensión de la complejidad de la cognición humana. 
En cada caso, las nuevas ideas han reavivado el campo y producido cambios 
cuantiosos. Es probable que la neuroimagen añada nuevas herramientas 
poderosas al repertorio técnico del neurocientífico. Sin embargo, esta 
herramienta solo es buena en la medida en que lo sea su usuario, lo que resalta la 
importancia de tener metodologías experimentales sólidas y marcos de trabajo 
teóricos bien establecidos que puedan conducir el desarrollo de estas técnicas y 
centrarlas en cuestiones importantes y tratables. La teoría multicomponente de la 
memoria de trabajo ha desempeñado esta función en el pasado. Confío en que 
siga haciéndolo en el futuro. 


Notas al pie 


* El término wetware es usado para describir la integración de conceptos de la 
construcción física conocida como «sistema nervioso central» y la construcción 
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